首页全站导航手机版加入收藏关注我们
全站导航
  • 手游行业
  • 游戏问答
  • 新游前瞻
  • 游戏动态
  • 视频攻略
  • 新游预告
  • 热游视频
  • 周边视频
  • 资讯中心
  • 游戏攻略
  • 礼包中心
  • 热门攻略
  • 游戏专区
  • 手游合集
  • 手游分类
  • 手游开服
  • 手游开测
  • 全部手游
  • 苹果排行
  • 安卓排行
  • 单机排行
  • 网游排行
  • 福利美图
  • 吐槽八卦
  • 内涵GIF
  • 游戏截图
  • 游戏壁纸
关注我们
手游巴士

资讯

  • 资讯
  • 游戏
  • 视频
  • 礼包
  • 图片
  • 首页
  • 游戏中心
  • 手游行业
  • 新游资讯
  • 新游预告
  • 游戏活动
  • 综合资讯
  • 硬件资讯
  • 游戏攻略
  • 游戏评测
当前位置:首页 > 手游资讯 > 业界资讯 > 54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

2023-07-29 13:31 来源:shouyoubus.com 作者:佚名

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

爆火的大模型,正在重塑谷歌DeepMind的机器人研究。

最新成果之一,就是他们耗时7个月打造的机器人项目RT-2,狠狠在网上火了一把:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

效果究竟有多好?

只需用人话下达命令,面前这个小家伙就能挥动机械臂,思考并完成“主人的任务”。

像是给流行歌手霉霉(Taylor Swift)递水、或是辨认明星球队Logo:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

甚至能主动思考,让它“捡起已灭绝的动物”,就能从狮子、鲸鱼、恐龙这三个塑料玩具中准确pick恐龙。

用网友的话来说,别小看这个能力,这是实现了从“灭绝的动物”到“塑料恐龙”的逻辑飞跃。

更“要命”的是,它还能轻松解决“给疲惫的人选一种饮料”这种需要结合思想链的多阶段推理问题——一听到命令小手就直奔红牛而去,简直不要太聪明。

有网友看完感叹:

等不及了,赶紧快进到给人类洗碗吧(手动狗头)

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

据了解,谷歌DeepMind这项成果由54位研究员合作产出,前前后后拉扯7个月,最终才变成我们看到的这样“so easy”。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

《纽约时报》介绍称,谷歌DeepMind机器人技术主管Vincent Vanhoucke认为,大模型彻底改变了他们部门的研究方向:

由于(大模型)这一变化,我们不得不重新考虑整个研究项目。

我们之前研究的很多东西,都已经完全失效了。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

所以,RT-2究竟能实现什么样的效果,这研究又具体是怎么一回事儿?

将多模态大模型“塞进”机械臂

这个名叫RT-2(Robotic Transformer 2)的机器人项目,是去年年底发布的RT-1的“进化版”。

相比于其他的机器人研究,RT-2的核心优势在于,不仅能理解“人话”,还能对“人话”进行推理,并转变为机器人能理解的指令,从而分阶段完成任务。

具体来说,它具备三大能力——符号理解(Symbol understanding)、推理(Reasoning)和人类识别(Human recognition)。

第一个能力是“符号理解”,能将大模型预训练的知识,直接延展到机器人此前没见过的数据上。例如机器人数据库中虽然没有“红牛”,但它却能从大模型的知识中理解并掌握“红牛”的外貌,并拿捏物品。

第二个能力是“推理”,这也是RT-2的核心优势,要求机器人掌握数学、视觉推理和多语言理解三大技能。

技能一,包含数学逻辑推理的命令,“将香蕉放到2+1的总和的位置”:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

技能二,视觉推理,像是“将草莓放进正确的碗中”:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

技能三,多语言理解,即使不用英语也能完成指令,例如用西班牙语命令它“从一堆物品中挑出最与众不同的那个”:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

第三个能力是人类识别,准确识别并理解人类的行为,像开头看到的“将水递给泰勒·斯威夫特”例子就是能力展现之一。

那么,这三个能力是怎么实现的?

简单来说,就是将视觉-文本多模态大模型(VLM)具备的“推理”、“识别”、“数学”等能力,和机器人的操作能力结合起来。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

为了实现这一点,研究人员直接给视觉-文本大模型(VLM)增加了一个模态,叫做“机器人动作模态”,从而把它变成了视觉-文本-动作大模型(VLA)。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

随后,将原本非常具体的机器人动作数据,转变成文本token。

例如将转动度数、放到哪个坐标点等数据,转变成文本“放到某个位置”。

这样一来,机器人数据也能被用到视觉-语言数据集中进行训练,同时在进行推理的过程中,原本的文本指令也会被重新转化为机器人数据,实现控制机器人等一系列操作。

没错,就是这么简单粗暴(手动狗头)

在这次的研究中,团队主要基于谷歌的一系列基础大模型来“做升级”,包括50亿和550亿的PaLI-X、30亿的PaLI以及120亿的PaLM-E。

为了提升大模型本身的能力,研究人员也下了不少功夫,把最近爆火的思维链、向量数据库和无梯度架构(no-gradient architectures)都用上了。

这一系列操作,也让RT-2和去年发布的RT-1相比,具有了不少新优势。

下面就来看看具体的实验结果。

性能可达RT-1三倍

RT-2使用上一代机器人模型RT-1的数据进行训练(也就是说数据没变,只是方法不同了)。

这些数据是用13个机器人在办公室搭建的一个厨房环境中耗时17个月收集到的。

在实际测试中(一共历经6000次),作者给了RT-2许多以前未见过的物体,需要RT-2在微调数据之外进行语义理解来完成任务。

结果完成的都相当不错:

包括从简单的识别字母、国旗、人物到从玩偶中识别陆生动物、选出颜色不相同的那只,甚至是捡起快要从桌上掉下去的零食等复杂的命令。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

而从符号理解、推理和人类识别这三个细分能力上来看,RT-2的两个变体都比RT-1和另一种视觉预训练方法VC-1要好很多,性能最高可达3倍。

如前文所述,这两个变体分别在120亿参数的PaLM-E和550亿参数的PaLI-X上进行训练。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

具体的泛化能力评估上,通过与多个基线模型的多类细分测试,最终发现RT-2性能提高了大约2倍。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

(稍显遗憾的是,我们还没看到它和其他团队最新基于LLM的机器人方法进行对比)

而为了更好地理解RT-2的不同设置如何影响泛化结果,作者又设计了两大类评估:

一是在模型尺寸上,仅在RT-2 PaLI-X变体分别采用50亿参数与550亿参数进行训练;

二是训练方法上,分别采用从头开始训练模型vs微调vs协同微调的方法。

最终结果表明,视觉语言模型预训练权重的重要性以及模型泛化能力有随着模型大小而提高的趋势。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

另外,作者还在开源语言表基准上评估了RT-2,结果显示它在模拟基准上实现了SOTA结果(90%vs之前的77%)。

最后,由于RT-2 PaLM-E变体是一个视觉-语言-动作模型,可以在单个神经网络中充当LLM、VLM和机器人控制器,因此RT-2还可以执行可控的思想链推理。

如下图所示的5个需要推理的任务中(尤其最后一个非常有意思:选择可以替代锤子的物品),它接到命令后会先输出自然语言步骤,然后再给出具体的动作token。

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

最最后,总结来说,这个最新的RT-2模型,不仅能更好地适用于不同的、机器此前没见过的场景中,泛化能力更好了;与此同时,由于有了更好的大模型加持,它也掌握了一些有难度的新能力,比如推理。

One More Thing

谷歌将机器人研究的重心放在大模型上,似乎也不是“空穴来风”。

就在这两天,他们和哥伦比亚大学合作的一篇关于“用大模型帮助获取更多机器人操作技能”的论文,同样很火:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

这篇论文提出了一种新的框架,不仅能让机器人很好地适应大模型,同时还能保留原本机器人的基础操作和控制能力:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

和RT-2有所不同的是,这一项目已经开源:

54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

属实是用大模型带动整个机器人部门升级了。

再联想到前不久李飞飞团队的具身智能成果,可以说,用大模型带动机器人着实成为一种研究趋势,且已经让我们看到了一波非常有潜力的进展。

对于这个研究方向,你有哪些期待?

项目地址:https://robotics-transformer2.github.io/

参考链接:

[1]https://twitter.com/GoogleDeepMind/status/1684903412834447360

[2]https://www.deepmind.com/blog/rt-2-new-model-translates-vision-and-language-into-action

[3]https://www.nytimes.com/2023/07/28/technology/google-robots-ai.html

[4]https://github.com/columbia-ai-robotics/scalingup

责任编辑:落木

以上就是手游巴士为您提供《54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类》的详细内容,更多精彩内容请继续阅读上一篇《收藏:哪些物品不能携带上火车?一图看懂》

表羞涩嘛~喜欢就点我

分享吧~提高逼格:

相关阅读

  • 2023-07-29 印尼耍蛇人表演时试图亲吻蛇被咬死 眼镜王蛇有多毒:一滴致命

  • 2023-07-29 收藏:哪些物品不能携带上火车?一图看懂

  • 2023-07-29 54人天团憋7个月!谷歌AGI机器人放大招:快进到替代人类

  • 2023-07-29 云顶之弈S9最强阵容,开云电竞大平台进行讲解

  • 2023-07-29 夏侯惇必学的细节!开云电竞大平台进行分析

  • 2023-07-29 为什么女生喜爱鲁班?开云电竞大平台分析原因

  • 2023-07-29 如何针对打野位诸葛?开云电竞大平台进行分析

  • 2023-07-29 东方曜连招教学思路,开云电竞大平台进行分析

  • 2023-07-29 原神胡桃公子攻略6-开云电竞大平台稳定详解

  • 2023-07-29 原神胡桃公子攻略5-开云电竞大平台稳定详解

  • 2023-07-29 原神胡桃公子攻略4-开云电竞大平台稳定详解

  • 2023-07-29 原神胡桃公子攻略3-开云电竞大平台稳定详解

  • 2023-07-29 原神胡桃公子攻略2-开云电竞大平台稳定详解

  • 2023-07-29 开云电竞大平台:曼城电竞获冠军杯亚军

  • 2023-07-29 开云电竞大平台:2023TGA腾讯电竞运动会夏季总决赛打响

  • 2023-07-29 开云电竞大平台:雄心可见!“组合拳”出击

  • 2023-07-29 顶尖法王必学细节,开云电竞大平台进行分析

  • 2023-07-29 开云电竞稳定《王牌战争:文明重启》

  • 2023-07-29 开云电竞大平台《拂晓》百战传奇

  • 2023-07-29 开云电竞稳定《自在西游》全方解析

  • 2023-07-29 开云电竞稳定《高能英雄》空降

  • 2023-07-29 开云电竞稳定《魔域口袋版》上新

  • 2023-07-29 机器人技术打破国外垄断 巨轮智能总经理意外去世:年仅45岁

  • 2023-07-29 《遗迹2》千面神开云电竞大平台成就攻略

  • 2023-07-29 各路厂商争抢年轻用户!ChinaJoy 2023开展:ShowGirl小姐姐依然亮眼

热点推荐

  • 大秘境、糖豆人《逆水寒手游》首次大更新又“缝疯了”大秘境、糖豆人《逆水寒手游》首次大更新又“缝疯了”
  • 好戏登场一曲咏情《倩女幽魂手游》x昆曲联动揭幕!好戏登场一曲咏情《倩女幽魂手游》x昆曲联动揭幕!
  • 《王牌战争:文明重启》手游x阿狸联动开启!《王牌战争:文明重启》手游x阿狸联动开启!
  • 《倩女手游》全民争霸赛、跨服高昌、暑期嘉年华精彩不断!《倩女手游》全民争霸赛、跨服高昌、暑期嘉年华精彩不断!

热门游戏

  • 时逆

    时逆

    立即下载
  • 剑侠世界

    剑侠世界

    立即下载
  • 铁甲风暴

    铁甲风暴

    立即下载
  • 三国志奇侠传

    三国志奇侠传

    立即下载
  • 蜀山战神

    蜀山战神

    立即下载
  • 人气动漫大乱斗

    人气动漫大乱斗

    立即下载

热点资讯

更多+
  • 啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
    啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
  • 轩辕剑之汉之云手游双属性职业阴阳战斗玩法
    轩辕剑之汉之云手游双属性职业阴阳战斗玩法
  • 莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上
    莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上

小编热推

更多+
无差别海选赛今日迎来最后一轮,28日淘汰赛阶段开启!

满分攻略

  • 戏怨第二章相思意怎么玩 戏怨第2章相思意通关攻略

    满分 戏怨第二章相思意怎么玩 戏怨第2章相思意通关攻略

    关
    查看全部
  • 斗罗大陆h5踏阵催坚第一关怎么过 斗罗大陆h5踏阵催坚第一关攻略

    满分 斗罗大陆h5踏阵催坚第一关怎么过 斗罗大陆h5踏阵催坚第一关攻略

    01关
    查看全部
  • 斗罗大陆h5踏阵催坚第二关怎么过 斗罗大陆h5踏阵催坚第二关攻略

    满分 斗罗大陆h5踏阵催坚第二关怎么过 斗罗大陆h5踏阵催坚第二关攻略

    02关
    查看全部

热门礼包

更多+

三国杀

三国杀 剩余:500/500 有效日期:2017-05-02

领取

三国杀

领取

三国杀愚人节礼包

三国杀愚人节礼包 剩余:500/500 有效日期:2017-05-31

领取

三国杀愚人节礼包

领取

三国杀独家礼包

三国杀独家礼包 剩余:500/500 有效日期:2017-07-26

领取

三国杀独家礼包

领取

三国杀移动版国庆礼包

三国杀移动版国庆礼包 剩余:500/500 有效日期:2017-11-29

领取

三国杀移动版国庆礼包

领取

一步高升新手礼包

一步高升新手礼包 剩余:491/1000 有效日期:2019-09-14

领取

一步高升新手礼包

领取

奶块首发大礼包

奶块首发大礼包 剩余:344/1900 有效日期:1970-01-01

领取

奶块首发大礼包

领取

奶块成长礼包

奶块成长礼包 剩余:297/1167 有效日期:2017-12-31

领取

奶块成长礼包

领取

植物大战僵尸2特权礼包

植物大战僵尸2特权礼包 剩余:232/300 有效日期:2018-05-31

领取

植物大战僵尸2特权礼包

领取

银河战舰代言人公测礼包

银河战舰代言人公测礼包 剩余:232/300 有效日期:2018-10-01

领取

银河战舰代言人公测礼包

领取

植物大战僵尸2豪华福包

植物大战僵尸2豪华福包 剩余:227/500 有效日期:2018-07-31

领取

植物大战僵尸2豪华福包

领取

热门合集

更多+
  • 适合女生玩的HTML5游戏

    查看合集
  • 2017手机游戏排行榜

    查看合集

手游资讯

NEWS
手游行业 手游活动 新游前瞻 综合资讯

最全攻略

RAIDERS
游戏资料 游戏攻略 硬件资讯 游戏问答

视频中心

VIDEO
视频攻略 新游预告 热门游戏 周边视频

游戏中心

GAME
手游合集 游戏分类 发号中心 热门专区

手游排行

TOP 100
安卓榜 苹果榜 单机榜 网游榜

手游巴士

手游巴士

  • 关于我们
  • 商务洽谈
  • 联系我们
  • 友情链接
  • 版权声明

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号