首页全站导航手机版加入收藏关注我们
全站导航
  • 手游行业
  • 游戏问答
  • 新游前瞻
  • 游戏动态
  • 视频攻略
  • 新游预告
  • 热游视频
  • 周边视频
  • 资讯中心
  • 游戏攻略
  • 礼包中心
  • 热门攻略
  • 游戏专区
  • 手游合集
  • 手游分类
  • 手游开服
  • 手游开测
  • 全部手游
  • 苹果排行
  • 安卓排行
  • 单机排行
  • 网游排行
  • 福利美图
  • 吐槽八卦
  • 内涵GIF
  • 游戏截图
  • 游戏壁纸
关注我们
手游巴士

资讯

  • 资讯
  • 游戏
  • 视频
  • 礼包
  • 图片
  • 首页
  • 游戏中心
  • 手游行业
  • 新游资讯
  • 新游预告
  • 游戏活动
  • 综合资讯
  • 硬件资讯
  • 游戏攻略
  • 游戏评测
当前位置:首页 > 手游资讯 > 业界资讯 > GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

2023-05-29 15:19 来源:shouyoubus.com 作者:佚名

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

继Windows Copilot发布后,微软Build大会热度又被一场演讲引爆。

前特斯拉AI总监Andrej Karpathy在演讲中认为思维树(tree of thoughts)与AlphaGo的蒙特卡洛树搜索(MCTS)有异曲同工之妙!

网友高呼:这是关于如何使用大语言模型和GPT-4模型的最详尽有趣的指南!

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

此外Karpathy透露,由于训练和数据的扩展,LLAMA 65B“明显比GPT-3 175B更强大”,并介绍了大模型匿名竞技场ChatBot Arena:

Claude得分介于ChatGPT 3.5和ChatGPT 4之间。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

网友表示,Karpathy的演讲一向很棒,而这次的内容也一如既往没有令大家失望。

随着演讲而爆火的,还有推特网友根据演讲整理的一份笔记,足足有31条,目前转赞量已超过3000+:

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

所以,这段备受关注的演讲,具体提到了哪些内容呢?

如何训练GPT助手?

Karpathy这次的演讲主要分为两个部分。

第一部分,他讲了如何训练一个“GPT助手”。

Karpathy主要讲述了AI助手的四个训练阶段:预训练(pre-training)、监督微调(supervised fine tuning)、奖励建模(reward modeling)和强化学习(reinforcement learning)。

每一个阶段都需要一个数据集。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

在预训练阶段,需要动用大量的计算资源,收集大量的数据集。在大量无监督的数据集上训练出一个基础模型。

Karpathy用了更多例子作补充:

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

接下来进入微调阶段。

使用较小的有监督数据集,通过监督学习对这个基础模型进行微调,就能创建一个能够回答问题的助手模型。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

他还展示了一些模型的进化过程,相信很多人之前已经看过上面这张“进化树”的图了。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

Karpathy认为目前最好的开源模型是Meta的LLaMA系列(因为OpenAI没有开源任何关于GPT-4的内容)。

在这里需要明确指出的是,基础模型不是助手模型。

虽然基础模型可以回答问题,但它所给出的回答并不可靠,可用于回答问题的是助手模型。在基础模型上进行训练的助手模型,通过监督微调,在生成回复和理解文本结构方面的表现将优于基础模型。

在训练语言模型时,强化学习是另一个关键的过程。

通过用人工标记的高质量的数据进行训练,可以使用奖励建模来创建一个损失函数,以改善其性能。然后,通过增加正向的标记,并降低负面标记的概率,来进行强化训练。

而在具有创造性的任务中,利用人类的判断力对于改进AI模型至关重要,加入人类的反馈可以更有效地训练模型。

经过人类反馈的强化学习后,就可以得到一个RLHF模型了。

模型训练好了,接下来就是如何有效利用这些模型解决问题了。

如何更好地使用模型?

在第二部分,Karpathy主要讨论了提示策略、微调、快速发展的工具生态系统以及未来的扩展等问题。

Karpathy又给出了具体示例来说明:

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

当我们在写文章时候,我们会进行很多的心理活动,需要考虑自己的表述是否正确。而对于GPT来说,这只是一个序列标记(a sequence of tokens)。

而提示(prompt)可以弥补这种认知差异。

Karpathy进一步解释了思维链提示的工作方式。

对于推理问题,要想让自然语言处理中Transformer的表现更好,需要让它一步一步地处理信息,而不能直接抛给它一个非常复杂的问题。

如果你给它几个例子,它会模仿这个例子的模版,最终生成的结果会更好。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

模型只能按照它的序列来回答问题,如果它生成的内容是错误的,你可以进行提示,让它重新生成。

如果你不要求它检查,它自己是不会检查的。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

这就涉及到了System1和System2的问题。

诺贝尔经济学奖得主丹尼尔卡尼曼在《思考快与慢》中提出,人的认知系统包含System1和System2两个子系统。System1主要靠直觉,而System2是逻辑分析系统。

通俗来说,System1是一个快速自动生成的过程,而System2是经过深思熟虑的部分。

这在最近一篇挺火的论文“Tree of thought”(思维树)中也有被提及。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

深思熟虑指的是,不是简单的给出问题的答案,而更像是与Python胶水代码一起使用的prompt,将许多prompt串联在一起。模型必须要维护多个提示,还必须要执行一些树搜索算法,来找出要扩展的提示。

Karpathy认为这种思路与AlphaGo非常相似:

AlphaGo在下围棋时,需要考虑下一枚棋子下在哪里。最初它是靠模仿人类来学习的。

但除此之外,它还进行了蒙特卡洛树搜索,可以得到具有多种可能性的策略。它可以对多种可能的下法进行评估,仅保留那些较好的策略。我认为这在某种程度上相当于AlphaGo。

对此,Karpathy还提到了AutoGPT:

我认为目前它的效果还不是很好,我不建议大家进行实际应用。我只是认为,随着时间的推移,我们或许可以从它的发展思路中汲取灵感。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

其次,还有一个小妙招是检索增强生成(retrieval agumented generation)和有效提示。

窗口上下文的内容就是transformers在运行时的记忆(working memory),如果你可以将与任务相关的信息加入到上下文中,那么它的表现就会非常好,因为它可以立即访问这些信息。

简而言之,就是可以为相关数据建立索引让模型可以高效访问。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

如果Transformers也有可参考的主要文件,它的表现会更好。

最后,Karpathy简单讲了一下在大语言模型中的约束提示(Constraint prompting)和微调。可以通过约束提示和微调来改进大语言模型。约束提示在大语言模型的输出中强制执行模板,而微调则调整模型的权重以提高性能。

我建议在低风险的应用中使用大语言模型,始终将它们与人工监督相结合,将它们看作是灵感和建议的来源,考虑copilots而不是让它们完全自主代理。

关于Andrej Karpathy

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

Andrej Karpathy博士毕业后的第一份工作,是在OpenAI研究计算机视觉。

后来OpenAI联合创始人之一的马斯克看上了Karpathy,把人挖到了特斯拉。但也因为这件事,马斯克和OpenAI彻底闹翻,最后还被踢出局。在特斯拉,Karpathy是Autopilot、FSD等项目的负责人。

今年二月份,在离开特斯拉7个月后,Karpathy再次加入了OpenAI。

最近他发推特表示,目前对开源大语言模型生态系统的发展饶有兴趣,有点像早期寒武纪爆发的迹象。

GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

传送门:

[1]https://www.youtube.com/watch?v=xO73EUwSegU(演讲视频)

[2]https://arxiv.org/pdf/2305.10601.pdf(“Treeof thought”论文)

责任编辑:随心

以上就是手游巴士为您提供《GPT现状终于有人讲清楚了!还得是马斯克钦点的天才》的详细内容,更多精彩内容请继续阅读上一篇《1799元 小米发布米家首款自发电动感单车:手机充电免电费》

表羞涩嘛~喜欢就点我

分享吧~提高逼格:

相关阅读

  • 2023-05-29 《暗黑破坏神:不朽》“毁灭新生”6月8日联动《暗黑破坏神IV》

  • 2023-05-29 应强制淘汰旧家电!董明珠:家电不能年轻人喜欢我就给他做什么

  • 2023-05-29 《九畿:岐风之旅》携手良渚文化 助力传统文化创新发展

  • 2023-05-29 比亚迪和特斯拉的“对垒” 正在进入一个新阶段

  • 2023-05-29 《三国鼎立OL》全新战区“乱世豪杰”6月1日15点火爆开启

  • 2023-05-29 实时跨服快乐社交,《新石器时代》带来全新社交圈

  • 2023-05-29 别让百万豪车 毁了你的吃饭家伙

  • 2023-05-29 荣耀90系列搭载创新动脉仿生VC:首发航天级导热凝胶

  • 2023-05-29 飙升到36.6℃!上海打破百年来5月气温最高纪录

  • 2023-05-29 2499元起 荣耀90/90 Pro发布:首发2亿像素写真相机 拍人像比肩单反

  • 2023-05-29 念念不忘 必有盲盒超跑!《王牌竞速》豪华补给超人气归来

  • 2023-05-29 江西多地加入“高温群聊” 体感平均温度超40℃

  • 2023-05-29 19点开始!京东618红包正式开抢:最高20618元 首发必中

  • 2023-05-29 零风险调光护眼屏 荣耀90系列全球首发3840Hz超高频屏幕技术

  • 2023-05-29 1799元 小米发布米家首款自发电动感单车:手机充电免电费

  • 2023-05-29 GPT现状终于有人讲清楚了!还得是马斯克钦点的天才

  • 2023-05-29 《未定事件簿》手游「约定之日」活动女神之影限时复刻 眷慕似海应许此生

  • 2023-05-29 《崩坏学园2》手游公主祈愿 托托莉·旅羁时光 形象限时UP!

  • 2023-05-29 《忘川风华录》手游×狼人杀联动即将开启!

  • 2023-05-29 减肥就非得痛苦吗?华为鸿蒙3全家桶打造运动健身新体验

  • 2023-05-29 浙江无人岛流拍 首任“岛主”成老赖 起拍价2785万元

  • 2023-05-29 阻止Wii模拟器登陆Steam!任天堂表态:模拟器非法

  • 2023-05-29 618换机怎么选?华为Mate 50系列最高优惠800元:实用耐用更好用

  • 2023-05-29 国产大飞机C919商用首飞成功!全机供应链揭秘

  • 2023-05-29 2023年最顶级LCD屏幕来了!Redmi Note 12T Pro明天预售

热点推荐

  • 实时跨服快乐社交,《新石器时代》带来全新社交圈实时跨服快乐社交,《新石器时代》带来全新社交圈
  • 《忘川风华录》手游×狼人杀联动即将开启!《忘川风华录》手游×狼人杀联动即将开启!
  • 《梦想世界3》官方助手第二批限服名单公布!《梦想世界3》官方助手第二批限服名单公布!
  • 剑问天地!《神都夜行录》X《中国龙泉》联动妖灵“龙渊”御龙而来!剑问天地!《神都夜行录》X《中国龙泉》联动妖灵“龙渊”御龙而来!

热门游戏

  • 时逆

    时逆

    立即下载
  • 剑侠世界

    剑侠世界

    立即下载
  • 铁甲风暴

    铁甲风暴

    立即下载
  • 三国志奇侠传

    三国志奇侠传

    立即下载
  • 蜀山战神

    蜀山战神

    立即下载
  • 人气动漫大乱斗

    人气动漫大乱斗

    立即下载

热点资讯

更多+
  • 啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
    啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
  • 轩辕剑之汉之云手游双属性职业阴阳战斗玩法
    轩辕剑之汉之云手游双属性职业阴阳战斗玩法
  • 莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上
    莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上

小编热推

更多+
念念不忘 必有盲盒超跑!《王牌竞速》豪华补给超人气归来

满分攻略

  • 原神恒动械画稻妻怎么过 原神3.7恒动械画第三关攻略

    满分 原神恒动械画稻妻怎么过 原神3.7恒动械画第三关攻略

    03关
    查看全部
  • 原神零时召唤第二关怎么过-原神零时召唤第三关攻略

    满分 原神零时召唤第二关怎么过-原神零时召唤第三关攻略

    03关
    查看全部
  • 羊了个羊今日攻略5.29 羊了个羊5月29日羊羊大世界和第二关怎么过

    满分 羊了个羊今日攻略5.29 羊了个羊5月29日羊羊大世界和第二关怎么过

    02关
    查看全部

热门礼包

更多+

三国杀

三国杀 剩余:500/500 有效日期:2017-05-02

领取

三国杀

领取

三国杀愚人节礼包

三国杀愚人节礼包 剩余:500/500 有效日期:2017-05-31

领取

三国杀愚人节礼包

领取

三国杀独家礼包

三国杀独家礼包 剩余:500/500 有效日期:2017-07-26

领取

三国杀独家礼包

领取

三国杀移动版国庆礼包

三国杀移动版国庆礼包 剩余:500/500 有效日期:2017-11-29

领取

三国杀移动版国庆礼包

领取

一步高升新手礼包

一步高升新手礼包 剩余:491/1000 有效日期:2019-09-14

领取

一步高升新手礼包

领取

奶块首发大礼包

奶块首发大礼包 剩余:344/1900 有效日期:1970-01-01

领取

奶块首发大礼包

领取

奶块成长礼包

奶块成长礼包 剩余:297/1167 有效日期:2017-12-31

领取

奶块成长礼包

领取

植物大战僵尸2特权礼包

植物大战僵尸2特权礼包 剩余:232/300 有效日期:2018-05-31

领取

植物大战僵尸2特权礼包

领取

银河战舰代言人公测礼包

银河战舰代言人公测礼包 剩余:232/300 有效日期:2018-10-01

领取

银河战舰代言人公测礼包

领取

植物大战僵尸2豪华福包

植物大战僵尸2豪华福包 剩余:227/500 有效日期:2018-07-31

领取

植物大战僵尸2豪华福包

领取

热门合集

更多+
  • 适合女生玩的HTML5游戏

    查看合集
  • 2017手机游戏排行榜

    查看合集

手游资讯

NEWS
手游行业 手游活动 新游前瞻 综合资讯

最全攻略

RAIDERS
游戏资料 游戏攻略 硬件资讯 游戏问答

视频中心

VIDEO
视频攻略 新游预告 热门游戏 周边视频

游戏中心

GAME
手游合集 游戏分类 发号中心 热门专区

手游排行

TOP 100
安卓榜 苹果榜 单机榜 网游榜

手游巴士

手游巴士

  • 关于我们
  • 商务洽谈
  • 联系我们
  • 友情链接
  • 版权声明

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号