纵观资讯 纵观资讯

当前位置: 首页 » 实时追踪 »

图灵奖得主三问人形机器人 45万家中国企业“仿生”成梦?

人形机器人科技领域的热门话题,尤其是近期,某国产机器人更成为舆论和公众新宠,风头一时无两。

但图灵奖得主Facebook首席人工智能科学家和纽约大学教授杨立昆“大嘴巴”又来了。杨立昆近期在一档播客节目中表示,“很多人形机器人演示令人印象深刻,但实际很蠢,不少机器人公司都在豪赌未来35AI会突飞猛进。”言辞之间,是对当下人形机器人智能性的严重质疑。

智能机器人,机器是个壳,AI做灵魂。杨立昆对AI的批评由来已久。早在20245月,他就在社交媒体上质疑AI威胁论,认为当前AI大模型的智力水平甚至不如家猫,缺乏推理能力和对物理世界的理解。

同年10月,在《华尔街日报》专访中,他再次强调AI威胁论是“胡说八道”,指出生成式AI仅擅长预测文本,缺乏真正的推理和常识。

他还批评马斯克、奥特曼(Oenp AI创始人)等对通用人工智能(AGI)的乐观预测,认为其缺乏科学依据。

20252月,在巴黎人工智能行动峰会上,杨立昆再次炮轰生成式AI,称其“无法达到人类智慧水平”,并呼吁学术界转向研究“联合嵌入预测架构(JEPA)”,以构建能理解物理世界的AI系统。

杨立昆(Yann LeCun)何许人也?

这位是人工智能领域的大拿之一,其核心成就包括发明卷积神经网络(CNN)并推动其实际应用。他于1987年提出CNN概念,1998年开发的LeNet-5成为首个成功应用于手写体识别的CNN模型,奠定了现代计算机视觉的基础。还在深度学习领域持续突破,改进反向传播算法,推动无监督与自监督学习研究,减少对标注数据的依赖,并提出能量模型等理论框架。

2018年,他因在深度学习的突破性贡献与辛顿、本吉奥共同获得图灵奖。

加入Meta后,他领导团队将AI技术应用于社交、医疗等多领域,并主导开发开源大模型Llama系列。其数百篇顶级论文与合著的《深度学习》著作,系统构建了学科理论体系。

作为学界与工业界的桥梁,杨立昆培养了大批人才,推动AI从实验室走向产业,被公认为计算机视觉与神经网络研究的先驱。

所以,杨立昆对人形机器人及AI的批评,可不是外行人看热闹。

诚然,人形机器人是一大风口,这些年,执着在人形机器人下注的企业很多。

波士顿动力可能是大家最早了解人形机器人的代表性企业,特斯拉的Optimus(擎天柱)人形机器人研发也在推进中。

而在国内,从优必选到宇树科技、稚晖君创立的智元机器,在人形机器人领域的身影也分外活跃。

数据显示,截至202412月底,全国共有45.17万家智能机器人产业企业,注册资本共计64445.57亿元。这其中,哪怕只有百分之一的企业是专注人形机器人,其投入也是天文数字。

但与此同时,对人形机器人热潮冷眼旁观的不止杨立昆一人。

作为RT-X项目(一个旨在提升机器人智能和泛化能力的研究项目)参与者的Wolfram Burgard教授接受媒体采访时指出,当下的基础模型训练方式有着能效上的巨大问题,它需要太多的算力和数据才能达到泛化的门槛。

他举了个例子:在RT-X数据集项目中,虽然他们收集了超过100万个片段,覆盖了机器人的500多项技能和在16万项具体任务上的表现,但当桌子高度稍有不同,RT-2就可能完全无法正确进行任务了。

机器人,到底要不要弄个人样?技术分歧的背后是产业实践的矛盾。

今年世界机器人大会上,人形机器人打咏春、跳热舞的视频刷屏社交网络,但在家庭场景演示中,叠衣、擦桌等基础任务频频失误。

人性机器人能前后空翻,却叠不好一件衣服?

原因在于,人形机器人需要通过传感器感知自身的姿态和位置,然后通过控制系统调整机械结构来完成动作,其过程主要依赖于预编程的算法和模型,不需要对物理世界进行深入的理解和推理。

相比之下,叠衣服则是一个更加复杂的任务。它要求机器人对物体的形状、质地、纹理等进行感知和理解,然后根据这些信息进行精确的操作。

上述现象称为目标驱动与规划能力缺失是当前AI技术面临的一个重大挑战。

分层规划是一种复杂的决策和执行过程,它涉及到将一个宏大的目标分解为一系列逐步细化的子目标,且这些子目标又可以进一步细分为具体的行动步骤。

人类和动物在日常生活中经常使用这种策略来解决问题或完成任务。例如,一个人想要做一顿饭,这个大目标可能被分解为准备食材、烹饪不同的菜肴、布置餐桌等多个子目标。每个子目标又包含更具体的动作,如切菜、调味、加热等。

相比之下,现有的AI系统往往缺乏这样的灵活性。尽管现代AI可以在特定领域内表现出色,例如围棋或象棋中的决策制定,但在面对复杂多变的真实世界任务时,它们的表现就显得力不从心了。

家务活动就是一个很好的例子,看似简单但其实包含了无数细微的动作和判断。例如,清理桌子不仅涉及物理上的移动物品,还需要决定哪些物品应该放在哪里,如何避免打翻水杯等。这些都需要对环境有深刻的理解以及灵活应对的能力。

现有AI系统的局限性在于它们通常依赖于预设的算法和大量训练数据来执行特定任务,而不是像人类那样基于经验进行即时调整。

如此意味着当面对未曾见过的情况或者需要跨多个领域综合考虑的问题时,AI可能会感到困惑

此外,由于缺乏对因果关系的理解,AI难以预测其行为可能带来的长期后果,这也是导致其规划能力受限的重要原因之一。

人是造物主的杰作。人手共有22个自由度,而当前大多数机械手,如夹爪形态(8个自由度)、6自由度仿人手机械手(同样8个自由度),以及全驱动灵巧手(如Shadow hand,超过20个自由度),均无法完美复刻人手的功能。

此外,能源与硬件的不可能三角进一步制约发展。人形机器人需在有限体积内平衡动力、续航与成本。高能耗传感器和复杂机械结构导致现有电池技术难以支撑长时间自主运行。

稚晖君创立的智元机器近日爆红,但讲到机器人的性能时,相关工作人员承认,目前只能达到人类效率的20%-30%,而且电池续航仅有两个小时。续航短也是业内人形机器人的普遍问题。 

用一个通俗的比喻,当下人形机器人就像垂垂老矣的白发翁,每做几个动作,就得停下来充电。

机器人行业突围,需正视三大现实。

首先是放弃“通用幻想”,深耕垂直场景。蓝橙实验室与清华大学合作的五轴并联加工机器人,专攻航空发动机叶片打磨,通过限定工作场景将精度提升至微米级;华中科技大学吸附式移动机器人聚焦船舶曲面焊接,放弃人形设计换取更强环境适应性。

其次是重构技术路线图。哈工大教授朱延河团队建立工业机器人开源架构,允许厂商共享运动控制算法,避免重复造轮子。

相关探索虽未突破根本,但指向更务实的技术迭代路径。

最后是重新定义“智能”标准。智能与否不看动作复杂度,而看任务泛化能力。工业机器人若实现自主更换夹具的模块化设计,或许比执着人形更易打开市场。

显然,围绕人形机器人的争论,是技术路线之争,更是对机器人及AI的认知之争。一方坚持人形是通用智能最佳载体,认为双足移动与人类环境天然兼容;另一方主张形态服务于功能,认为轮式、臂式或模块化设计更易商业化。工业机器人历经60年发展,从Unimate机械臂到现代协作机器人,技术突破均围绕专用场景展开。人形机器人若执着于通用性标签,可能重蹈早期自动驾驶企业盲目追求全场景的覆辙。

机器人产业的终极目标不是创造人造人,而是拓展人类能力的边界。向左是继续追逐像人的幻想,向右是拥抱细分场景的实用主义。选择哪条路径,将决定这个行业是真正走向为人所常用,还是又一场资本狂欢的泡沫。

(转自:评论员毕舸)

未经允许不得转载: 纵观资讯 » 图灵奖得主三问人形机器人 45万家中国企业“仿生”成梦?