智源研究院院长王仲远:长期看人形机器人有优势,但短期在产业落地上仍有难点
2025-03-29 20:03:34
  • 0
  • 0
  • 0

红星资本局3月29日消息,在2025中关村论坛年会期间,北京智源人工智能研究院(以下简称“智源研究院”)院长王仲远接受了红星资本局在内的媒体采访。

王仲远在回答红星资本局时表示,各种构型的机器人都可以接入具身智能,具身智能也不是为人形机器人单独设计的一种智能。长期看人形机器人有优势,但短期在产业落地上仍有难点。

他认为,今年人工智能应用预计会出现大爆发,特别是在大语言模型的落地应用上。他还强调,多模态是大模型必备能力。

王仲远 主办方供图

具身智能并非“绑定”人形机器人

单臂、双臂等构型机器人均可接入

尽管人形机器人的赛道火热,但也有观点认为,大部分工作其实都并非必须用到“人形机器人”这个构型,如何理解人形机器人发展的必要性?

“某种程度上我赞同这个观点,”王仲远在回答红星资本局的提问时表示,现在行业里也有不少机器人公司,已经去迭代轮式构型的机器人,因为这能够极大的避免双足机器人本身不稳定带来的能力局限。

“我们认为,从长期来看,人形机器人一定有它的优势,因为我们人类是双足行走的,本身就是大自然选择的一个结果,整个社会的基础设施也是依靠人类的这种构型来进行建设的。”

王仲远认为,“类人”这种构型一定能更好适应社会的基础设施,同时也能从海量的互联网数据中去更好地学习人类技能。因此从长期来看,他认为人体机器人一定是一个正确的方向,有利于具身智能或者具身大脑模型的迭代。

“但从短期来看,我们关注的是产业落地,确实人形机器人在产业落地上还面临很多困难,现在很多的机器人依然处在‘能走’的阶段,正在从‘能走’往‘走得快’‘走得稳’的阶段进行发展。”

王仲远认为,单臂、双臂等各种构型的机器人都可以接入具身智能,具身智能并不是为人形机器人单独设计的一种智能。

今年人工智能应用预计会出现大爆发

多模态是大模型必备能力

外界有投资人声音表示,不太看好具身智能产业。但王仲远站在研究机构的角度来看,技术是长期的,他对于具身智能长期的发展非常乐观。“就好像10年前我们看待无人驾驶技术一样,一定会进入应用落地的阶段。”

王仲远指出,今年在人工智能的应用上预计会出现大爆发。“特别是中国存在海量场景及应用,当基础模型能力达到可用时,就能迅速落地应用。”他特别提到了大语言模型的落地应用,也存在非常大的产业爆发的可能性。

“但我也反复强调过,大语言模型是远远不够的,在真实行业中数据都不是简单的文本,所以‘多模态’是大模型绕不开的一种能力。”

王仲远表示,现在的多模态大模型特别是多模态理解大模型还处于相对早期的阶段,2024年智源研究院发布了全球首个原生多模态大模型Emu3,能够将文本、图像、视频从开始就进行原生统一的训练,他认为这样一种统一原生多模态大模型有望帮助大模型在各行各业更好落地。

此外,王仲远表示,外界认为现在的模型,尤其基础模型的性能提升相对缓慢,一个很重要的原因就是在数据、算力上遇到瓶颈。他提到,整个大模型的技术还远没有到尽头,算力依然是紧缺的。

红星新闻记者 王田

编辑 肖世清


 
最新文章
相关阅读