人形机器人,是科技领域的热门话题,尤其是近期,某国产机器人更成为舆论和公众新宠,风头一时无两。
但图灵奖得主、Facebook首席人工智能科学家和纽约大学教授杨立昆的“大嘴巴”又来了。杨立昆近期在一档播客节目中表示,“很多人形机器人演示令人印象深刻,但实际很蠢,不少机器人公司都在豪赌未来3到5年AI会突飞猛进。”言辞之间,是对当下人形机器人智能性的严重质疑。
智能机器人,机器是个壳,AI做灵魂。杨立昆对AI的批评由来已久。早在2024年5月,他就在社交媒体上质疑AI威胁论,认为当前AI大模型的智力水平甚至不如家猫,缺乏推理能力和对物理世界的理解。
同年10月,在《华尔街日报》专访中,他再次强调AI威胁论是“胡说八道”,指出生成式AI仅擅长预测文本,缺乏真正的推理和常识。
他还批评马斯克、奥特曼(Oenp AI创始人)等对通用人工智能(AGI)的乐观预测,认为其缺乏科学依据。
2025年2月,在巴黎人工智能行动峰会上,杨立昆再次炮轰生成式AI,称其“无法达到人类智慧水平”,并呼吁学术界转向研究“联合嵌入预测架构(JEPA)”,以构建能理解物理世界的AI系统。
杨立昆(Yann LeCun)何许人也?
这位是人工智能领域的大拿之一,其核心成就包括发明卷积神经网络(CNN)并推动其实际应用。他于1987年提出CNN概念,1998年开发的LeNet-5成为首个成功应用于手写体识别的CNN模型,奠定了现代计算机视觉的基础。还在深度学习领域持续突破,改进反向传播算法,推动无监督与自监督学习研究,减少对标注数据的依赖,并提出能量模型等理论框架。
2018年,他因在深度学习的突破性贡献与辛顿、本吉奥共同获得图灵奖。
加入Meta后,他领导团队将AI技术应用于社交、医疗等多领域,并主导开发开源大模型Llama系列。其数百篇顶级论文与合著的《深度学习》著作,系统构建了学科理论体系。
作为学界与工业界的桥梁,杨立昆培养了大批人才,推动AI从实验室走向产业,被公认为计算机视觉与神经网络研究的先驱。
所以,杨立昆对人形机器人及AI的批评,可不是外行人看热闹。
诚然,人形机器人是一大风口,这些年,执着在人形机器人下注的企业很多。
波士顿动力可能是大家最早了解人形机器人的代表性企业,特斯拉的Optimus(擎天柱)人形机器人研发也在推进中。
而在国内,从优必选到宇树科技、稚晖君创立的智元机器,在人形机器人领域的身影也分外活跃。
数据显示,截至2024年12月底,全国共有45.17万家智能机器人产业企业,注册资本共计64445.57亿元。这其中,哪怕只有百分之一的企业是专注人形机器人,其投入也是天文数字。
但与此同时,对人形机器人热潮冷眼旁观的不止杨立昆一人。
作为RT-X项目(一个旨在提升机器人智能和泛化能力的研究项目)参与者的Wolfram Burgard教授接受媒体采访时指出,当下的基础模型训练方式有着能效上的巨大问题,它需要太多的算力和数据才能达到泛化的门槛。
他举了个例子:在RT-X数据集项目中,虽然他们收集了超过100万个片段,覆盖了机器人的500多项技能和在16万项具体任务上的表现,但当桌子高度稍有不同,RT-2就可能完全无法正确进行任务了。
机器人,到底要不要弄个人样?技术分歧的背后是产业实践的矛盾。
今年世界机器人大会上,人形机器人打咏春、跳热舞的视频刷屏社交网络,但在家庭场景演示中,叠衣、擦桌等基础任务频频失误。
人性机器人能前后空翻,却叠不好一件衣服?
原因在于,人形机器人需要通过传感器感知自身的姿态和位置,然后通过控制系统调整机械结构来完成动作,其过程主要依赖于预编程的算法和模型,不需要对物理世界进行深入的理解和推理。
相比之下,叠衣服则是一个更加复杂的任务。它要求机器人对物体的形状、质地、纹理等进行感知和理解,然后根据这些信息进行精确的操作。
上述现象称为目标驱动与规划能力缺失,是当前AI技术面临的一个重大挑战。
分层规划是一种复杂的决策和执行过程,它涉及到将一个宏大的目标分解为一系列逐步细化的子目标,且这些子目标又可以进一步细分为具体的行动步骤。
人类和动物在日常生活中经常使用这种策略来解决问题或完成任务。例如,一个人想要做一顿饭,这个大目标可能被分解为准备食材、烹饪不同的菜肴、布置餐桌等多个子目标。每个子目标又包含更具体的动作,如切菜、调味、加热等。
相比之下,现有的AI系统往往缺乏这样的灵活性。尽管现代AI可以在特定领域内表现出色,例如围棋或象棋中的决策制定,但在面对复杂多变的真实世界任务时,它们的表现就显得力不从心了。
家务活动就是一个很好的例子,看似简单但其实包含了无数细微的动作和判断。例如,清理桌子不仅涉及物理上的移动物品,还需要决定哪些物品应该放在哪里,如何避免打翻水杯等。这些都需要对环境有深刻的理解以及灵活应对的能力。
现有AI系统的局限性,在于它们通常依赖于预设的算法和大量训练数据来执行特定任务,而不是像人类那样基于经验进行即时调整。
如此意味着,当面对未曾见过的情况或者需要跨多个领域综合考虑的问题时,AI可能会感到“困惑”。
此外,由于缺乏对因果关系的理解,AI难以预测其行为可能带来的长期后果,这也是导致其规划能力受限的重要原因之一。
人是造物主的杰作。人手共有22个自由度,而当前大多数机械手,如夹爪形态(8个自由度)、6自由度仿人手机械手(同样8个自由度),以及全驱动灵巧手(如Shadow hand,超过20个自由度),均无法完美复刻人手的功能。
此外,能源与硬件的“不可能三角”进一步制约发展。人形机器人需在有限体积内平衡动力、续航与成本。高能耗传感器和复杂机械结构,导致现有电池技术难以支撑长时间自主运行。
稚晖君创立的智元机器近日爆红,但讲到机器人的性能时,相关工作人员承认,目前只能达到人类效率的20%-30%,而且电池续航仅有两个小时。续航短也是业内人形机器人的普遍问题。
用一个通俗的比喻,当下人形机器人就像垂垂老矣的白发翁,每做几个动作,就得停下来充电。
机器人行业突围,需正视三大现实。
首先是放弃“通用幻想”,深耕垂直场景。蓝橙实验室与清华大学合作的五轴并联加工机器人,专攻航空发动机叶片打磨,通过限定工作场景将精度提升至微米级;华中科技大学吸附式移动机器人聚焦船舶曲面焊接,放弃人形设计换取更强环境适应性。
其次是重构技术路线图。哈工大教授朱延河团队建立工业机器人开源架构,允许厂商共享运动控制算法,避免重复造轮子。
相关探索虽未突破根本,但指向更务实的技术迭代路径。
最后是重新定义“智能”标准。智能与否不看动作复杂度,而看任务泛化能力。工业机器人若实现自主更换夹具的模块化设计,或许比执着人形更易打开市场。
显然,围绕人形机器人的争论,是技术路线之争,更是对机器人及AI的认知之争。一方坚持“人形是通用智能最佳载体”,认为双足移动与人类环境天然兼容;另一方主张“形态服务于功能”,认为轮式、臂式或模块化设计更易商业化。工业机器人历经60年发展,从Unimate机械臂到现代协作机器人,技术突破均围绕专用场景展开。人形机器人若执着于“通用性”标签,可能重蹈早期自动驾驶企业盲目追求全场景的覆辙。
机器人产业的终极目标不是创造“人造人”,而是拓展人类能力的边界。向左,是继续追逐“像人”的幻想,向右,是拥抱细分场景的实用主义。选择哪条路径,将决定这个行业是真正走向为人所常用,还是又一场资本狂欢的泡沫。
(转自:评论员毕舸)