本文作者:peiziseo

“地表最强”人形机器人亮相:视觉&语音推理能力 每天打工20+小时

peiziseo 2024-08-07 00:56:07 27 抢沙发
“地表最强”人形机器人亮相:视觉&语音推理能力 每天打工20+小时摘要: ...

  财联社8月6日讯(编辑 史正丞)当地时间周二早晨,获得、英伟达、OpenAI投资的人形机器人明星企业Figure如期发布最新款人形机器人Figure 02。基于机载算力和各个组件的全方位升级,AI人形机器人朝着“进厂打工”又迈进了一大步。

  顺便一提,随着人工智能大模型的飞跃式发展,这款被不少媒体称为“地表最强人形机器人”的AI设备,也已经具备视觉推理和聊天沟通的能力——操作机器人的默认UI就是语音控制。

  新产品有哪些亮点?

  与2023年发布的第一代产品相比,Figure 02最为明显的区别在于外观的彻底重构——机器人完全采用外骨骼结构(由外皮承担负载和压力),机器人的电源和算力布线集成在机体内部,从而提高了机器人的可靠性,也使得封装更加紧实。

(两代产品外观差异显著,来源:Figure)(两代产品外观差异显著,来源:Figure)

  Figure的创始人兼首席执行官布雷特·爱德考克(Brett Adcock)透露,为了这个设计,公司还重新定制了电线端子和连接器。

  当然,人形机器人最关键的升级点,依然是如何从一堆电线、芯片和算法,拼出一个活灵活现的“打工(机器)人”。

  公司披露,Figure 02身上总共装了6个RGB摄像头,分别位于头部、胸前和后背,因此这个机器人也拥有着“超人”视觉。

  配合输入的图像资料,机器人能够通过AI驱动的视觉系统感知和理解真实的物理世界。Figure 02配备了机载的视觉语言模型(VLM),使其能够进行快速的常识性视觉推理

  爱德考克表示,相较于上一代产品,Figure 02的机载计算和AI推理能力翻了3倍,使得许多真实世界的AI任务能够完全自主执行。公司的AI数据引擎将不断提供最新的模型,供机器人在本地GPU上运行。

  除了视觉以外,Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型,通过机载麦克风和扬声器与人类进行对话。爱德考克也透露,这个机器人的默认UI是语音。

  虽然在和OpenAI的较劲升级后,AI实时语音聊天已经不再是夺人眼球的新鲜功能,但对于人形机器人而言,应用这项技术仍有重大的意义。毕竟这个70公斤的大铁块,迟早有一天将会与人类在同一个屋檐下“打螺丝”,能够响应语音指令,将会是人类重要的安全工具。

  在投资者最为关心的连接器等方面,Figure并没有给出明确的信息。公司仅表示,Figure 02上搭载的第四代机械手具备16自由度,拥有与人类相当的力量,能够完成许多近似人类的工作。同时整个机械手的机械、电器、控制和传感器设计,都是由公司内部完成的。

  最后,这台机器人还有一个不怎么起眼但很重要的升级,机器人内部的电池组容量提高了50%至2.25KWh。爱德考克解释称,这个设计旨在最大限度地延长机器人的运行时间,公司希望Figure 02能够实现每天实际有效的工作时间超过20小时。

  值得一提的是,公司官网的参数说明一栏中,显示Figure 02的续航时间只有5小时。合理推断爱德考克提供的应该是“充电+干活”的极限工作时间。

  稍有遗憾的是,Figure公司目前并没有广泛推出Figure 02的时间表,仅暗示各位吃瓜群众不要把想象力局限在“机器人进厂打螺丝”上。公司表示,Figure 02将人类形态的灵巧性与先进的人工智能相结合,可以在商业应用中执行各种任务,并且在不久的将来,还可以在家中执行各种任务。

  已经“进厂”

  作为发布前的试验,YY>汽车的装配厂已经接纳过一批Figure 02“实习工人”。除了主动执行汽车装配的程序外,AI也能自动识别和纠正已习得行为习惯的错误。

  宝马集团也在周二发表公开声明称,Figure 02在美国斯帕坦堡工厂试运行期间,从事的是将钣金部件插入特定装置的工作,机器人必须特别灵巧才能完成这个工作。宝马集团表示,使用机器人可以避免员工从事不符合人体工程学的笨拙、累人任务。集团正在与Figure一起测试和评估,如何在汽车生产中安全地使用人形机器人。

(来源:宝马官网)(来源:宝马官网)

  宝马集团生产管理委员会成员Milan Nedeljković表示,通过早期的测试,双方现在正在确定人形机器人在生产中的可能应用。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,27人围观)参与讨论

还没有评论,来说两句吧...