首页全站导航手机版加入收藏关注我们
全站导航
  • 手游行业
  • 游戏问答
  • 新游前瞻
  • 游戏动态
  • 视频攻略
  • 新游预告
  • 热游视频
  • 周边视频
  • 资讯中心
  • 游戏攻略
  • 礼包中心
  • 热门攻略
  • 游戏专区
  • 手游合集
  • 手游分类
  • 手游开服
  • 手游开测
  • 全部手游
  • 苹果排行
  • 安卓排行
  • 单机排行
  • 网游排行
  • 福利美图
  • 吐槽八卦
  • 内涵GIF
  • 游戏截图
  • 游戏壁纸
关注我们
手游巴士

资讯

  • 资讯
  • 游戏
  • 视频
  • 礼包
  • 图片
  • 首页
  • 游戏中心
  • 手游行业
  • 新游资讯
  • 新游预告
  • 游戏活动
  • 综合资讯
  • 硬件资讯
  • 游戏攻略
  • 游戏评测
当前位置:首页 > 手游资讯 > 业界资讯 > GPT-4变笨了?!文本、代码质量急剧下滑

GPT-4变笨了?!文本、代码质量急剧下滑

2023-06-02 13:52 来源:shouyoubus.com 作者:佚名

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

大模型天花板GPT-4,它是不是……变笨了?

先是少数用户提出质疑,随后大量网友表示自己也注意到了,还贴出不少证据。

GPT-4变笨了?!文本、代码质量急剧下滑

有人反馈,把GPT-4的3小时25条对话额度一口气用完了,都没解决自己的代码问题。

无奈切换到GPT-3.5,反倒解决了。

GPT-4变笨了?!文本、代码质量急剧下滑

总结下大家的反馈,最主要的几种表现有:

以前GPT-4能写对的代码,现在满是Bug

回答问题的深度和分析变少了

响应速度比以前快了

这就引起不少人怀疑,OpenAI是不是为了节省成本,开始偷工减料?

两个月前GPT-4是世界上最伟大的写作助手,几周前它开始变得平庸。我怀疑他们削减了算力或者把它变得没那么智能。

GPT-4变笨了?!文本、代码质量急剧下滑

这就不免让人想起微软新必应“出道即巅峰”,后来惨遭“前额叶切除手术”能力变差的事情……

网友们相互交流自己的遭遇后,“几周之前开始变差”,成了大家的共识。

一场舆论风暴同时在Hacker News、Reddit和Twitter等技术社区形成。

GPT-4变笨了?!文本、代码质量急剧下滑

这下官方也坐不住了。

OpenAI开发者推广大使Logan Kilpatrick,出面回复了一位网友的质疑:

API 不会在没有我们通知您的情况下更改。那里的模型处于静止状态。

GPT-4变笨了?!文本、代码质量急剧下滑

不放心的网友继续追问确认“就是说GPT-4自从3月14日发布以来都是静态的对吧?”,也得到了Logan的肯定回答。

GPT-4变笨了?!文本、代码质量急剧下滑

“我注意到对于某些提示词表现不一致,只是由于大模型本身的不稳定性吗?”也得到了“Yes”的回复。

GPT-4变笨了?!文本、代码质量急剧下滑

但是截至目前,针对网页版GPT-4是否被降级过的两条追问都没有得到回答,并且Logan在这段时间有发布别的内容。

GPT-4变笨了?!文本、代码质量急剧下滑

那么事情究竟如何,不如自己上手测试一波。

对于网友普遍提到GPT-4写代码水平变差,我们做了个简单实验。

实测GPT-4“炼丹”本领下降了吗?

3月底,我们曾实验过让GPT-4“炼丹”,用Python写一个多层感知机来实现异或门。

GPT-4变笨了?!文本、代码质量急剧下滑
△ShareGPT截图,界面稍有不同

让GPT-4改用numpy不用框架后,第一次给出的结果不对。

在修改两次代码后,运行得到了正确结果。第一次修改隐藏神经元数量,第二次把激活函数从sigmoid修改成tanh。

GPT-4变笨了?!文本、代码质量急剧下滑

6月2日,我们再次尝试让GPT-4完成这个任务,但换成了中文提示词。

这回GPT-4第一次就没有使用框架,但给的代码仍然不对。

后续只修改一次就得到正确结果,而且换成了力大砖飞的思路,直接增加训练epoch数和学习率。

GPT-4变笨了?!文本、代码质量急剧下滑

GPT-4变笨了?!文本、代码质量急剧下滑

回答的文字部分质量也未观察到明显下降,但响应速度感觉确实有变快。

由于时间有限,我们只进行了这一个实验,且由于AI本身的随机性,也并不能否定网友的观察。

最早4月19日就有人反馈

我们在OpenAI官方Discord频道中搜索,发现从4月下旬开始,就不时有零星用户反馈GPT-4变差了。

GPT-4变笨了?!文本、代码质量急剧下滑

但这些反馈并未引发大范围讨论,也没有得到官方正式回应。

5月31日,Hacker News和Twitter同天开始大量有网友讨论这个问题,成为整个事件的关键节点。

HackerNews一位网友指出,在GPT-4的头像还是黑色的时候更强,现在紫色头像版在修改代码时会丢掉几行。

在Twitter上较早提出这个问题的,是HyperWrite(一款基于GPT API开发的写作工具)的CEO,Matt Shumer。

GPT-4变笨了?!文本、代码质量急剧下滑

但这条推文却引发了许多网友的共鸣,OpenAI员工回复的推文也正是针对这条。

不过这些回应并没让大家满意,反而讨论的范围越来越大。

比如Reddit上一篇帖子提到,原来能回答代码问题的GPT-4,现在连哪些是代码哪些是问题都分不出来了。

GPT-4变笨了?!文本、代码质量急剧下滑

在其他网友的追问下,帖子作者对问题出现的过程进行了概述,还附上了和GPT的聊天记录。

GPT-4变笨了?!文本、代码质量急剧下滑

对于OpenAI声称模型从三月就没有改动过,公开层面确实没有相关记录。

ChatGPT的更新日志中,分别在1月9日、1月30日、2月13日提到了对模型本身的更新,涉及改进事实准确性和数学能力等。

但自从3月14日GPT-4发布之后就没提到模型更新了,只有网页APP功能调整和添加联网模式、插件模式、苹果APP等方面的变化。

GPT-4变笨了?!文本、代码质量急剧下滑

假设真如OpenAI所说,GPT-4模型本身的能力没有变化,那么这么多人都感觉它表现变差是怎么回事呢?

很多人也给出了自己的猜想。

第一种可能的原因是心理作用。

Keras创始人Fran?ois Chollet就表示,不是GPT的表现变差,而是大家渡过了最初的惊喜期,对它的期待变高了。

GPT-4变笨了?!文本、代码质量急剧下滑

Hacker News上也有网友持相同观点,并补充到人们的关注点发生了改变,对GPT失误的敏感度更高了。

GPT-4变笨了?!文本、代码质量急剧下滑

抛开人们心理感受的差异,也有人怀疑API版本和网页版本不一定一致,但没什么实据。

还有一种猜测是在启用插件的情况下,插件的额外提示词对要解决的问题来说可能算一种污染。

GPT-4变笨了?!文本、代码质量急剧下滑
△WebPilot插件中的额外提示词

这位网友就表示,在他看来GPT表现变差正是从插件功能开始公测之后开始的。

GPT-4变笨了?!文本、代码质量急剧下滑

也有人向OpenAI员工询问是否模型本身没变,但推理参数是否有变化?

GPT-4变笨了?!文本、代码质量急剧下滑

量子位也曾偶然“拷问”出ChatGPT在iOS上的系统提示词与网页版并不一致。

如果在手机端开启一个对话,它会知道自己在通过手机与你交互。

会把回答控制在一到两句话,除非需要长的推理。

不会使用表情包,除非你明确要求他使用。

GPT-4变笨了?!文本、代码质量急剧下滑
△不一定成功,大概率拒绝回答

那么如果在网页版继续一个在iOS版开启的对话而没意识到,就可能观察到GPT-4回答变简单了。

总之,GPT-4自发布以来到底有没有变笨,目前还是个未解之谜。

但有一点可以确定:

3月14日起大家上手玩到的GPT-4,从一开始就不如论文里的。

与人类对齐让AI能力下降

微软研究院发表的150多页刷屏论文《AGI的火花:GPT-4早期实验》中明确:

他们早在GPT-4开发未完成时就得到了测试资格,并进行了长期测试。

后来针对论文中很多惊艳例子,网友都不能成功用公开版GPT-4复现。

目前学术界有个观点是,后来的RLHF训练虽然让GPT-4更与人类对齐——也就更听从人类指示和符合人类价值观——但让也让它自身的推理等能力变差。

论文作者之一、微软科学家张弋在中文播客节目《What’s Next|科技早知道》S7E11期中也提到:

那个版本的模型,比现在外面大家都可以拿得到的GPT-4还要更强,强非常非常多。

举例来说,微软团队在论文中提到,他们每隔相同一段时间就让GPT-4使用LaTeX中的TikZ画一个独角兽来追踪GPT-4能力的变化。

论文中展示的最后一个结果,画得已经相当完善。

GPT-4变笨了?!文本、代码质量急剧下滑

但论文一作Sebastien Bubeck后续在MIT发表演讲时透露了更多信息。

后来当OpenAI开始关注安全问题的时候,后续版本在这个任务中变得越来越糟糕了。

GPT-4变笨了?!文本、代码质量急剧下滑

与人类对齐但并不降低AI自身能力上限的训练方法,也成了现在很多团队的研究方向,但还在起步阶段。

除了专业研究团队之外,关心AI的网友们也在用自己的办法追踪着AI能力的变化。

有人每天让GPT-4画一次独角兽,并在网站上公开记录。

GPT-4变笨了?!文本、代码质量急剧下滑

从4月12日开始,直到现在也还没看出来个独角兽的大致形态。

GPT-4变笨了?!文本、代码质量急剧下滑

当然网站作者表示,自己让GPT-4使用SVG格式画图,与论文中的TikZ格式不一样也有影响。

并且4月画的与现在画的似乎只是一样差,也没看出来明显退步。

最后来问问大家,你是GPT-4用户么?最近几周有感到GPT-4能力下降么?欢迎在评论区聊聊。

责任编辑:上方文Q

以上就是手游巴士为您提供《GPT-4变笨了?!文本、代码质量急剧下滑》的详细内容,更多精彩内容请继续阅读上一篇《N饭准备迎接!英伟达CEO黄仁勋到中国时间曝光:网友喊话RTX40显卡降价促销》

表羞涩嘛~喜欢就点我

分享吧~提高逼格:

相关阅读

  • 2023-06-02 N饭准备迎接!英伟达CEO黄仁勋到中国时间曝光:网友喊话RTX40显卡降价促销

  • 2023-06-02 GPT-4变笨了?!文本、代码质量急剧下滑

  • 2023-06-02 学生网购小石头收到7斤巨石 画面很荒谬很搞笑:网友笑谈赚了

  • 2023-06-02 《速激11》果然不是结束:《速度与激情》确认制作独立电影

  • 2023-06-02 捷豹路虎发布全新品牌Logo!路虎车标从此成“遗产”

  • 2023-06-02 真公路坦克!极氪001被满载工程车撞翻压顶 乘员舱抗住了

  • 2023-06-02 原价300元:星巴克家享黑咖啡10包25元大促(不到1折)

  • 2023-06-02 高三师生的双向奔赴太戳人心了:最后一课师生落泪拥抱

  • 2023-06-02 还因续航焦虑不敢买电车吗?极氪001千里续航版交付:纯电1032km

  • 2023-06-02 国产大飞机正式商业运营 波音CEO:C919是一架好飞机

  • 2023-06-02 幼儿园摆20桌请200孩子吃席庆六一:每桌有龙虾、烧鸡、牛肉

  • 2023-06-02 保时捷公布新盾徽:历时3年设计 年底前大规模启用

  • 2023-06-02 一大波卖惨账号熄火了 抖音新规:禁止公益类账号变现

  • 2023-06-02 顺滑好入口:张裕葡小萄赤霞珠甜红葡萄酒750ml*2瓶39.9元

  • 2023-06-02 给孩子买豪车就差2个亿怎么办?用电锯做一辆!

  • 2023-06-02 售价58.2万!史上最贵高尔夫R 333限量版发布

  • 2023-06-02 尼康Z8禁用非原装电池 理由是出于安全考虑 用户:吃相难看

  • 2023-06-02 《暗黑4》今天开启抢先体验:主机豪华版玩家却被“堵在门外”

  • 2023-06-02 卢伟冰:Redmi K60在2000-3000档无敌 销量甩开友商

  • 2023-06-02 女孩放弃入职后收到HR千字回复 内容真诚到网友点赞:本人称帮助大

  • 2023-06-02 骁龙8 Gen3来了!骁龙技术峰会定档10月24-26日

  • 2023-06-02 国产性能车天花板!领克03高性能版首发:2.0T榨出350马力

  • 2023-06-02 899元!小米MIJIA智能音频眼镜官宣:6月9日正式开售

  • 2023-06-02 理想车主跑高速 竟让婴儿平躺在副驾驶 网友直呼心真大

  • 2023-06-02 媒体评苹果直播首秀:低估果粉智商 侮辱直播带货

热点推荐

  • 《机动都市阿尔法》希里斯全新儿童节主题S级外观正式上线!《机动都市阿尔法》希里斯全新儿童节主题S级外观正式上线!
  • 六一《魔域口袋版》联动积木免费送 参与即领兔年兽六一《魔域口袋版》联动积木免费送 参与即领兔年兽
  • 《新石器时代》开启安卓终极测试,海量福利助你重回史前乐园!《新石器时代》开启安卓终极测试,海量福利助你重回史前乐园!
  • 最棒的高达网游!《机动战士高达:激战任务2》今日免费公测最棒的高达网游!《机动战士高达:激战任务2》今日免费公测

热门游戏

  • 时逆

    时逆

    立即下载
  • 剑侠世界

    剑侠世界

    立即下载
  • 铁甲风暴

    铁甲风暴

    立即下载
  • 三国志奇侠传

    三国志奇侠传

    立即下载
  • 蜀山战神

    蜀山战神

    立即下载
  • 人气动漫大乱斗

    人气动漫大乱斗

    立即下载

热点资讯

更多+
  • 啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
    啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
  • 轩辕剑之汉之云手游双属性职业阴阳战斗玩法
    轩辕剑之汉之云手游双属性职业阴阳战斗玩法
  • 莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上
    莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上

小编热推

更多+
《暗区突围》农场快速模式限时返场,自由组队轻松开局!

满分攻略

  • 羊了个羊今日攻略6.2 羊了个羊6月2日羊羊大世界和第二关怎么过

    满分 羊了个羊今日攻略6.2 羊了个羊6月2日羊羊大世界和第二关怎么过

    02关
    查看全部
  • 羊了个羊6月2日攻略 羊了个羊游戏攻略6月2日第二关

    满分 羊了个羊6月2日攻略 羊了个羊游戏攻略6月2日第二关

    02关
    查看全部
  • 原神零时召唤第二关怎么过 零时召唤璃月篇通关攻略

    满分 原神零时召唤第二关怎么过 零时召唤璃月篇通关攻略

    02关
    查看全部

热门礼包

更多+

三国杀

三国杀 剩余:500/500 有效日期:2017-05-02

领取

三国杀

领取

三国杀愚人节礼包

三国杀愚人节礼包 剩余:500/500 有效日期:2017-05-31

领取

三国杀愚人节礼包

领取

三国杀独家礼包

三国杀独家礼包 剩余:500/500 有效日期:2017-07-26

领取

三国杀独家礼包

领取

三国杀移动版国庆礼包

三国杀移动版国庆礼包 剩余:500/500 有效日期:2017-11-29

领取

三国杀移动版国庆礼包

领取

一步高升新手礼包

一步高升新手礼包 剩余:491/1000 有效日期:2019-09-14

领取

一步高升新手礼包

领取

奶块首发大礼包

奶块首发大礼包 剩余:344/1900 有效日期:1970-01-01

领取

奶块首发大礼包

领取

奶块成长礼包

奶块成长礼包 剩余:297/1167 有效日期:2017-12-31

领取

奶块成长礼包

领取

植物大战僵尸2特权礼包

植物大战僵尸2特权礼包 剩余:232/300 有效日期:2018-05-31

领取

植物大战僵尸2特权礼包

领取

银河战舰代言人公测礼包

银河战舰代言人公测礼包 剩余:232/300 有效日期:2018-10-01

领取

银河战舰代言人公测礼包

领取

植物大战僵尸2豪华福包

植物大战僵尸2豪华福包 剩余:227/500 有效日期:2018-07-31

领取

植物大战僵尸2豪华福包

领取

热门合集

更多+
  • 适合女生玩的HTML5游戏

    查看合集
  • 2017手机游戏排行榜

    查看合集

手游资讯

NEWS
手游行业 手游活动 新游前瞻 综合资讯

最全攻略

RAIDERS
游戏资料 游戏攻略 硬件资讯 游戏问答

视频中心

VIDEO
视频攻略 新游预告 热门游戏 周边视频

游戏中心

GAME
手游合集 游戏分类 发号中心 热门专区

手游排行

TOP 100
安卓榜 苹果榜 单机榜 网游榜

手游巴士

手游巴士

  • 关于我们
  • 商务洽谈
  • 联系我们
  • 友情链接
  • 版权声明

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号