纵观资讯 纵观资讯

当前位置: 首页 » 实时追踪 »

让网友惊呼“炸裂”的智元灵犀X2,究竟强在哪里

智元机器人创始人彭志辉(稚晖君)今天在B站更新了他的作品——一款“三合一”全新机器人灵犀X2。它是一款支持高自由度运动能力的双足人形机器人,也是一款搭载情感交互引擎的情感交互机器人,还是一款初步具备通用任务执行能力的具身机器人,“像人一样灵动”。

萌翻全球的“大白”机器人。《超能陆战队》截图

豆豆眼、圆脑袋、大脚板……憨态可掬的外形不禁让人想到10年前那部风靡全球的动画片《超能陆战队》中的治疗机器人“大白”。影片中“大白”被人声唤醒、睁眼,查看房间的摆设,然后试图将“肥胖”的身子从狭小的空间中挪出的举动,如今已然成真。截至昨晚7点,视频的播放量已达90万,彭志辉也喜提新头衔——上海“钢铁侠”。

运动能力超群,会玩平衡车能缝葡萄皮

灵犀X2与“大白”一样,使用了亲和的柔性材料,摸上去弹力十足。虽然是个身高1.3米的“小学生”,但其全身拥有28个自由度,运动属性拉满。视频中,灵犀X2不仅会骑自行车、滑滑板、玩平衡车,还能丝滑操作缝葡萄皮,让网友惊呼“炸裂”。值得一提的是,灵犀X2的运动能力是自生成的,而非事先设定。

缝葡萄皮。

在《超能陆战队》上映的2015年,主流机器人还需要人为“指路”。卡耐基-梅隆大学曾花费10年时间造一台名为“漫步者”的机器人,每走一步,它都要更新头脑中的环境轮廓图。作为头脑的中央电脑可管理“漫步者”的激光成像仪、传感器、气压足肢、齿轮箱和电机马达,接收到不同模块传回的信息并计算后,“漫步者”才开始漫步。灵犀X2的运动算法与大语言模型一样,源自强化学习,智能体能从每秒数万次的环境交互和动作数据中找到突破运动瓶颈的方法。换言之,它的运动能力也是一个“黑箱”,能够根据指令做出相应动作,但人们并不清楚它经历了怎样的思考。这一特性也让灵犀X2个性十足,视频中有位灵犀X2“家族成员”经常踩测试人员的脚,被贴上性格暴躁的标签。

毫秒级交互反应,像亲人一样“唠家常”

“如果我的狗和你一起掉进水里,我先救谁?”“先救狗狗吧,我没事。”“如果给你看《银翼杀手》,你会不会哭到短路?”“不会哭,但我会感慨万千。”你能想象这是两段发生在人与机器人之间的实时对话吗?彭志辉将灵犀X2定义为第一台真正具备复杂交互能力的“灵动机器人”。基于“视觉-语言模型”的多模态交互大模型“硅光动语”赋予了它通过视觉理解和认知世界的能力,甚至能通过面部表情和语音语调精准判断人类的情感状态,并作出相应回应。

毫秒级的人机交互。

毫秒级的交互反应则源于智元X实验室团队通过边缘侧大脑、端到端的模型架构,以及大量工程优化。边缘侧大脑是机器人或智能设备中部署在本地(即边缘端)的人工智能处理单元,可在不依赖云端的情况下完成实时决策、数据分析和任务执行。灵犀X2还实现了通过识别环境与人交互。当彭志辉拿着一瓶牛奶和一瓶咖啡,问它想睡觉的人应该喝哪个时,它很肯定地回答:“喝牛奶吧。”

泛化能力强,成为家庭的“吉祥三宝”

彭志辉很懂机器人落地的“痛点”。作为一款主打家用的机器人型号,灵犀的发展目标被定义为“吉祥三宝”——保安、保姆、保洁。事实上,相较于工业和商业场景,家庭场景对机器人的安全性和智能度要求更高。

互相充电。

家庭的工作场景是不固定的,因此需要机器人的泛化能力,也就是机器人对新鲜场景的适应能力。在本体层面,灵犀X2可装配包括灵巧手在内的各种末端;在模型训练方面,智元开源了业界最大之一的机器人真机和仿真数据集,并提出了大小脑系统架构。全新构架的通用具身智能基座模型“启元大模型”也让其能力更加泛化,一个需要学习数万条数据才能学会的倒水动作,在新架构下只需学习上千条就会。尽管业界估计人形机器人进家庭大约还需5年,但此次发布的灵犀X2让人们相信“一机一户”的日子已然不远。“最好的作品永远是下一个。”彭志辉在视频中埋了个彩蛋——会是脚踩风火轮的哪吒机器人完整版吗?

未来的“哪吒完全体”

原标题:让网友惊呼“炸裂”的智元灵犀X2,究竟强在哪里

未经允许不得转载: 纵观资讯 » 让网友惊呼“炸裂”的智元灵犀X2,究竟强在哪里