首页手机版加入收藏关注我们

资讯

资讯
游戏
视频
礼包
图片

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

2023-05-29 15:19 来源：shouyoubus.com 作者：佚名

用手机看

扫描二维码随身看资讯使用手机二维码应用扫描右侧二维码，您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

继Windows Copilot发布后，微软Build大会热度又被一场演讲引爆。

前特斯拉AI总监Andrej Karpathy在演讲中认为思维树（tree of thoughts）与AlphaGo的蒙特卡洛树搜索（MCTS）有异曲同工之妙！

网友高呼：这是关于如何使用大语言模型和GPT-4模型的最详尽有趣的指南！

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

此外Karpathy透露，由于训练和数据的扩展，LLAMA 65B“明显比GPT-3 175B更强大”，并介绍了大模型匿名竞技场ChatBot Arena:

Claude得分介于ChatGPT 3.5和ChatGPT 4之间。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

网友表示，Karpathy的演讲一向很棒，而这次的内容也一如既往没有令大家失望。

随着演讲而爆火的，还有推特网友根据演讲整理的一份笔记，足足有31条，目前转赞量已超过3000+：

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

所以，这段备受关注的演讲，具体提到了哪些内容呢？

如何训练GPT助手？

Karpathy这次的演讲主要分为两个部分。

第一部分，他讲了如何训练一个“GPT助手”。

Karpathy主要讲述了AI助手的四个训练阶段：预训练（pre-training）、监督微调（supervised fine tuning）、奖励建模（reward modeling）和强化学习（reinforcement learning）。

每一个阶段都需要一个数据集。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

在预训练阶段，需要动用大量的计算资源，收集大量的数据集。在大量无监督的数据集上训练出一个基础模型。

Karpathy用了更多例子作补充：

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

接下来进入微调阶段。

使用较小的有监督数据集，通过监督学习对这个基础模型进行微调，就能创建一个能够回答问题的助手模型。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

他还展示了一些模型的进化过程，相信很多人之前已经看过上面这张“进化树”的图了。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

Karpathy认为目前最好的开源模型是Meta的LLaMA系列（因为OpenAI没有开源任何关于GPT-4的内容）。

在这里需要明确指出的是，基础模型不是助手模型。

虽然基础模型可以回答问题，但它所给出的回答并不可靠，可用于回答问题的是助手模型。在基础模型上进行训练的助手模型，通过监督微调，在生成回复和理解文本结构方面的表现将优于基础模型。

在训练语言模型时，强化学习是另一个关键的过程。

通过用人工标记的高质量的数据进行训练，可以使用奖励建模来创建一个损失函数，以改善其性能。然后，通过增加正向的标记，并降低负面标记的概率，来进行强化训练。

而在具有创造性的任务中，利用人类的判断力对于改进AI模型至关重要，加入人类的反馈可以更有效地训练模型。

经过人类反馈的强化学习后，就可以得到一个RLHF模型了。

模型训练好了，接下来就是如何有效利用这些模型解决问题了。

如何更好地使用模型？

在第二部分，Karpathy主要讨论了提示策略、微调、快速发展的工具生态系统以及未来的扩展等问题。

Karpathy又给出了具体示例来说明：

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

当我们在写文章时候，我们会进行很多的心理活动，需要考虑自己的表述是否正确。而对于GPT来说，这只是一个序列标记（a sequence of tokens）。

而提示（prompt）可以弥补这种认知差异。

Karpathy进一步解释了思维链提示的工作方式。

对于推理问题，要想让自然语言处理中Transformer的表现更好，需要让它一步一步地处理信息，而不能直接抛给它一个非常复杂的问题。

如果你给它几个例子，它会模仿这个例子的模版，最终生成的结果会更好。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

模型只能按照它的序列来回答问题，如果它生成的内容是错误的，你可以进行提示，让它重新生成。

如果你不要求它检查，它自己是不会检查的。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

这就涉及到了System1和System2的问题。

诺贝尔经济学奖得主丹尼尔卡尼曼在《思考快与慢》中提出，人的认知系统包含System1和System2两个子系统。System1主要靠直觉，而System2是逻辑分析系统。

通俗来说，System1是一个快速自动生成的过程，而System2是经过深思熟虑的部分。

这在最近一篇挺火的论文“Tree of thought”（思维树）中也有被提及。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

深思熟虑指的是，不是简单的给出问题的答案，而更像是与Python胶水代码一起使用的prompt，将许多prompt串联在一起。模型必须要维护多个提示，还必须要执行一些树搜索算法，来找出要扩展的提示。

Karpathy认为这种思路与AlphaGo非常相似：

AlphaGo在下围棋时，需要考虑下一枚棋子下在哪里。最初它是靠模仿人类来学习的。

但除此之外，它还进行了蒙特卡洛树搜索，可以得到具有多种可能性的策略。它可以对多种可能的下法进行评估，仅保留那些较好的策略。我认为这在某种程度上相当于AlphaGo。

对此，Karpathy还提到了AutoGPT：

我认为目前它的效果还不是很好，我不建议大家进行实际应用。我只是认为，随着时间的推移，我们或许可以从它的发展思路中汲取灵感。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

其次，还有一个小妙招是检索增强生成（retrieval agumented generation）和有效提示。

窗口上下文的内容就是transformers在运行时的记忆（working memory），如果你可以将与任务相关的信息加入到上下文中，那么它的表现就会非常好，因为它可以立即访问这些信息。

简而言之，就是可以为相关数据建立索引让模型可以高效访问。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

如果Transformers也有可参考的主要文件，它的表现会更好。

最后，Karpathy简单讲了一下在大语言模型中的约束提示（Constraint prompting）和微调。可以通过约束提示和微调来改进大语言模型。约束提示在大语言模型的输出中强制执行模板，而微调则调整模型的权重以提高性能。

我建议在低风险的应用中使用大语言模型，始终将它们与人工监督相结合，将它们看作是灵感和建议的来源，考虑copilots而不是让它们完全自主代理。

关于Andrej Karpathy

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

Andrej Karpathy博士毕业后的第一份工作，是在OpenAI研究计算机视觉。

后来OpenAI联合创始人之一的马斯克看上了Karpathy，把人挖到了特斯拉。但也因为这件事，马斯克和OpenAI彻底闹翻，最后还被踢出局。在特斯拉，Karpathy是Autopilot、FSD等项目的负责人。

今年二月份，在离开特斯拉7个月后，Karpathy再次加入了OpenAI。

最近他发推特表示，目前对开源大语言模型生态系统的发展饶有兴趣，有点像早期寒武纪爆发的迹象。

GPT现状终于有人讲清楚了！还得是马斯克钦点的天才

传送门：

[1]https://www.youtube.com/watch?v=xO73EUwSegU（演讲视频）

[2]https://arxiv.org/pdf/2305.10601.pdf（“Treeof thought”论文）

责任编辑：随心

以上就是手游巴士为您提供《GPT现状终于有人讲清楚了！还得是马斯克钦点的天才》的详细内容,更多精彩内容请继续阅读上一篇《1799元小米发布米家首款自发电动感单车：手机充电免电费》

表羞涩嘛~喜欢就点我

分享吧~提高逼格：

相关阅读

2023-05-29 实时跨服快乐社交，《新石器时代》带来全新社交圈
2023-05-29 别让百万豪车毁了你的吃饭家伙
2023-05-29 荣耀90系列搭载创新动脉仿生VC：首发航天级导热凝胶
2023-05-29 飙升到36.6℃！上海打破百年来5月气温最高纪录
2023-05-29 2499元起荣耀90/90 Pro发布：首发2亿像素写真相机拍人像比肩单反

2023-05-29 浙江无人岛流拍首任“岛主”成老赖起拍价2785万元
2023-05-29 阻止Wii模拟器登陆Steam！任天堂表态：模拟器非法
2023-05-29 618换机怎么选？华为Mate 50系列最高优惠800元：实用耐用更好用
2023-05-29 国产大飞机C919商用首飞成功！全机供应链揭秘
2023-05-29 2023年最顶级LCD屏幕来了！Redmi Note 12T Pro明天预售

热点推荐

热门游戏

热点资讯

更多+

小编热推

更多+

念念不忘必有盲盒超跑！《王牌竞速》豪华补给超人气归来

满分攻略

满分原神恒动械画稻妻怎么过原神3.7恒动械画第三关攻略

03关

查看全部
满分原神零时召唤第二关怎么过-原神零时召唤第三关攻略

03关

查看全部
满分羊了个羊今日攻略5.29 羊了个羊5月29日羊羊大世界和第二关怎么过

02关

查看全部

热门礼包

更多+

三国杀剩余：500/500 有效日期：2017-05-02

三国杀愚人节礼包剩余：500/500 有效日期：2017-05-31

三国杀愚人节礼包

三国杀独家礼包剩余：500/500 有效日期：2017-07-26

三国杀独家礼包

三国杀移动版国庆礼包剩余：500/500 有效日期：2017-11-29

三国杀移动版国庆礼包

一步高升新手礼包剩余：491/1000 有效日期：2019-09-14

一步高升新手礼包

奶块首发大礼包剩余：344/1900 有效日期：1970-01-01

奶块首发大礼包

奶块成长礼包剩余：297/1167 有效日期：2017-12-31

奶块成长礼包

植物大战僵尸2特权礼包剩余：232/300 有效日期：2018-05-31

植物大战僵尸2特权礼包

银河战舰代言人公测礼包剩余：232/300 有效日期：2018-10-01

银河战舰代言人公测礼包

植物大战僵尸2豪华福包剩余：227/500 有效日期：2018-07-31

植物大战僵尸2豪华福包

热门合集

更多+

适合女生玩的HTML5游戏
查看合集
2017手机游戏排行榜
查看合集

手游资讯 NEWS: 手游行业手游活动新游前瞻综合资讯

最全攻略 RAIDERS: 游戏资料游戏攻略硬件资讯游戏问答

视频中心 VIDEO: 视频攻略新游预告热门游戏周边视频

游戏中心 GAME: 手游合集游戏分类发号中心热门专区

手游排行 TOP 100: 安卓榜苹果榜单机榜网游榜

手游巴士

手游巴士

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号