全球首个!谷歌旗下DeepMind展示用于通用机器人的AI智能体RoboCat:仅需100次训练便能完成任务,还能自我改进提升
机器人正迅速成为我们日常生活的一部分,但它们通常只用于特定任务。虽然人工智能领域的最新进展可以使机器人在许多方面发挥作用,但全球在通用机器人制造方面的进展仍然较慢,部分原因是收集真实世界的训练数据需要大量的时间。近日,谷歌旗下AI团队DeepMind的最新研究或可解决该领域面临的这一“痛点”。
美东时间6月20日,DeepMind展示了用于机器人的AI智能体RoboCat。DeepMind称其为全球首个能解决和适应多重任务的智能体。更重要的是,RoboCat是一个可以自我改进的AI代理,其可以操作不同的机械臂,而且只需最少100次演示即可解决任务,并从其自生成的数据中进行改进。
谷歌展示全球首个多任务AI智能体
谷歌旗下AI团队DeepMind的最新论文介绍了一种能够进行自我改进的AI代理,本质上是由AI赋能的软件程序,相当于机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat更具“通用性”,并可实现自我改进、自我提升。
(相关资料图)
图片来源:DeepMind截图
DeepMind在之前的研究中探索了如何开发支持大规模学习多任务的机器人,并将语言模型理解与辅助机器人的现实世界能力相结合。这个名为RoboCat的机器人智能体是全球首个能解决和适应多重任务的AI智能体,能够学习在不同的机械臂上执行各种任务,然后自我生成新的训练数据来对其进行改进。
RoboCat的学习速度比其他先进模型快得多——只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。这种能力将有助于加速机器人研究,因为这减少了对人类监督训练的需求,也是创造通用机器人的重要一步。
DeepMind的研究科学家、RoboCat团队的共同作者Alex Lee表示,“我们证明,一个大模型可以解决多个真实机器人承载的各种任务,并能迅速适应新的任务。”
据DeepMind,RoboCat基于其多模态模型Gato(西班牙语“猫”的意思),它可以在模拟和物理环境中处理语言、图像和动作。DeepMind将Gato的架构与一个大型训练数据集结合并起来,该数据集由各种机器人手臂的图像序列和动作组成,可以解决数百种任务。
在DeepMind演示视频中,RoboCat已经可以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务。这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。目前RoboCat完成一项新任务的成功率已经在初期36%的基础上提升了一倍。
图片来源:DeepMind截图
基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据。它学习的新任务越多,它就能更好地学习和解决额外的新任务。DeepMind的论文认为,执行任务成功率的大幅提升,是由于RoboCat的经验越来越丰富,就像人们在特定领域加深学习时发展出更多样化的技能一样。RoboCat独立学习技能和快速自我完善的能力,特别是当应用于不同机器人设备时,将有助于为未来的研究铺平道路。
图片来源:DeepMind截图
具身智能将引领AI下一个浪潮
《每日经济新闻》记者注意到,目前在机器人领域,包括特斯拉、谷歌、亚马逊、英伟达、腾讯等巨头已经有所布局。然而,正如DeepMind上述论文指出,由于训练机器人需要大量的时间,因此智能化水平仍不足,难以实现大规模的商业化。而RoboCat的问世或许能解决这一“痛点”。
其实,DeepMind的RoboCat只是AI赋能机器人的主要案例之一。今年以来,已经有数家公司将语言模型运用到了机器人上:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月,阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月,英伟达发布全新自主移动机器人平台。
得益于此,人工智能加持的机器人化身具身智能(Embodied Intelligence)吸引了全球的广泛关注。
马斯克在特斯拉2023年股东大会上便表示,人形机器人将是今后特斯拉主要的长期价值来源,“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200亿个,远超电动车的数量”。英伟达创始人黄仁勋在ITF World 2023半导体大会上也表示,AI下一个浪潮将是“具身智能”。
图片来源:东吴证券研报截图
东吴证券研报指出,具身智能首先需要听懂人类语言,分解任务、规划子任务,移动中识别物体,与环境交互,最终完成任务。东吴证券认为人形机器人很好地契合了具身智能的要求,有望成为标杆应用。“机器人研究的关键在于让机器人适应人类环境,最终走进千家万户的生活(工业、餐饮、医疗等多领域)。人形机器人有望率先在B端上量,最终打开C端市场。远期市场空间可观。”
东吴证券预计,2035年,假设人形机器人价格为20万元,且照顾、陪伴功能分别为美国/欧洲/亚洲市场累计新增了5%/7%/4%的渗透率,即单年渗透率分别为1%/1.4%/0.8%。在较悲观/中性/较乐观的场景中,家庭场景的市场规模将分别达到3.00万亿/3.66万亿/4.26万亿元。
关键词:
相关阅读
-
全球首个!谷歌旗下DeepMind展示用于通...
◎RoboCat智能体更具“通用性”,并可实现自我改进、自我提升,为创... -
全球看热讯:巴哥犬交易吧_巴哥犬俱乐部
1、伴不一定是同类的多陪陪狗狗因为巴哥是很忧郁自尊心很强的狗多陪他 -
电凯能源有限公司_凯塔能源
1、能源的发展从木柴(旧时代)到煤炭、石油、天然气、水电(常规)到 -
一问到底丨“烧烤”模式频发 厄尔尼诺...
专家表示,此次厄尔尼诺对我国冬季气候和夏季降水有显著影响 -
湖北阳新:打好生态旅游牌 将美景变“...
央广网黄石6月20日消息6月19日,一场淅淅沥沥的小雨过后,位于湖北省黄 -
吴桥县人民检察院干警在辖区开展宣传活...
6月是安全生产月。近日,吴桥县人民检察院干警在辖区开展宣传活动,向 -
全球滚动:倒计时5天!天津夏季达沃斯,...
倒计时5天!天津夏季达沃斯,我们准备好了! -
奋进中国 大江澎湃 | 一条龙舟,穿越千年
阳气至盛,飞龙在天。仲夏时节,一年中最为“中正”的日子到了,这... -
世界实时:6月21日基金净值:广发诚享混...
6月21日,广发诚享混合A最新单位净值为0 6871元,累计净值为0 6871元, -
世界百事通!郧阳区一中举行足球比赛
近日,郧阳区一中高一年级举行了为期三天的足球比赛,丰富校园文化生活 -
天天速递!上饶银行广丰支行用行动助力中考
6月17日,上饶银行广丰支行在广丰中学考点开展爱心助考志愿服务。通过 -
世界快报:数九从哪一天开始_哪一天是...
1、每年从冬至算起九,每九天为一个单位。有几个民间谚语是这样说的, -
追求“锂”想,南昌成立首个锂电科技学...
大江网 大江新闻客户端讯全媒体记者左阳天报道:6月20日上午,南昌全市 -
【世界播资讯】江西着力提升残疾人民生...
本报讯信息日报全媒体记者谢梦丽报道:6月20日,由江西省政府新闻办、 -
【预防未成年人网络沉迷】一图教你如何...
由于未成年人心智不成熟、缺乏必要的媒介素养和自控能力等因素,更容易 -
长城微纪录 | 北庄一家人
大喜的日子越发近了。趁着假期,封京生带着未婚妻张微回了趟老家,石家 -
高码率电影下载_电影的最高码率是多少
想必现在有很多小伙伴对于电影的最高码率是多少方面的知识都比较想要了 -
血精灵术士职业任务_血精灵牧师职业任务...
想必现在有很多小伙伴对于血精灵牧师职业任务方面的知识都比较想要了解 -
塔勒布:我们是猎人,只有在随机应变的...
继《随机致富的傻瓜》《黑天鹅》和《反脆弱》系列论著出版后,《肥尾效 -
温彬:稳增长政策加力,下半年经济有望...
中国民生银行首席经济学家温彬等撰文称,预计随着政策效应的持续释放,