首页全站导航手机版加入收藏关注我们
全站导航
  • 手游行业
  • 游戏问答
  • 新游前瞻
  • 游戏动态
  • 视频攻略
  • 新游预告
  • 热游视频
  • 周边视频
  • 资讯中心
  • 游戏攻略
  • 礼包中心
  • 热门攻略
  • 游戏专区
  • 手游合集
  • 手游分类
  • 手游开服
  • 手游开测
  • 全部手游
  • 苹果排行
  • 安卓排行
  • 单机排行
  • 网游排行
  • 福利美图
  • 吐槽八卦
  • 内涵GIF
  • 游戏截图
  • 游戏壁纸
关注我们
手游巴士

资讯

  • 资讯
  • 游戏
  • 视频
  • 礼包
  • 图片
  • 首页
  • 游戏中心
  • 手游行业
  • 新游资讯
  • 新游预告
  • 游戏活动
  • 综合资讯
  • 硬件资讯
  • 游戏攻略
  • 游戏评测
当前位置:首页 > 手游资讯 > 业界资讯 > 数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

2023-08-14 17:30 来源:shouyoubus.com 作者:佚名

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

用AI生成的指令微调羊驼大模型,数学能力超ChatGPT——

微软最新开源大模型WizardMath来了。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

如下图所示,经过GSM8k数据集测试,WizardMath数学能力直接击败了ChatGPT、Claude Instant 1、PaLM 2-540B等一众大模型——

并且是在参数只有700亿,远不及后三者的情况之下。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

HuggingFace已上线3个在线可玩版本(分别为7B、13B和70B参数),各种数学题可以直接丢进去试一试。

比如解决下面这道四次多项式方程:

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

或者是一道简单的微积分:

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

亦或者是稍微修改过的拉格朗日方程推导:

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

它都全部正确(过程也不需要等太久)。

有网友向作者表示:

效果真的很惊人,感谢你们对开源LLM的贡献。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

目前,相关代码、复现方式以及论文也都开源或上线,GitHub短短几天已揽获4.8k标星。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

那么,WizardMath究竟是如何做到的?

用AI生成的指令增强大模型能力

OpenAI的大模型(InstructGPT、GPT-4等)能够取得巨大成功、去执行各种复杂和多样化的任务,一部分原因是使用了真实人类用户生成的开放域指令数据进行了微调。

然而,不是谁都能像这家公司一样获得这样的指令数据集。

一是因为整个注释过程极其昂贵且耗时,二是人工难以创建出足够比例的高难度指令。

因此,开发出一种成本相对较低的、大规模开放域指令自动生产方法,成为当下指令调优语言模型的关键。

在此,作者将他们的方法命名为Evol Instruction。

它是一种利用AI来代替人类自动生成涵盖各种难度级别开放域指令的新方法。

具体而言,Evol Instruction分为指令进化器和指令消除器。

其中指令进化器可通过深度进化(蓝线)或广度进化(红线)两种路径,将简单指令升级为更复杂的指令或创建一条全新指令。

具体执行哪一条?随机选择就好。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

其中,深度进化的具体“进化法”,则是通过五种类型的操作来完成,包括:

添加约束(add constraints)、深化(deepening)、具体化(concretizing)、增加推理步骤(increase reasoning steps)和使输入复杂化(complicate input)。

由于所有指令均由AI完成,有时难免会出现错误。因此,指令消除器就是用于过滤失败指令的。

以下是一个具体示例,该方法从“1+1=?”开始,最终通过以上步骤自动生成了相当多的新指令。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

通过重复这一生成过程,最终我们就能得到足够多的指令,然后将它们合并并随机打乱,组成一个难度级别均匀分布的指令集,就可以对基础大模型进行微调了。

在此,作者选择Alpaca的训练数据(仅由175条人工创建的种子指令生成)作为初始数据集,然后使用ChatGPT的API执行了四个进化周期,最终获得25万条指令。

为了与Vicuna的70k真实用户数据(ShareGPT)进行公平比较,作者从这25万条数据中抽取了等量的样本,训练LLaMA 7B模型,最终得到WizardLM,结果WizardLM的性能明显优于Vicuna。

(Alpaca:斯坦福在LLaMa-7B基础上微调出来的模型;Vicuna,UC伯克利在LLaMa-13B的基础上微调得来)

此外,在更为复杂的测试指令下,人类更喜欢WizardLM的输出,而非ChatGPT,这表明该方法可以显着提高LLM处理复杂指令的能力。

基于此,作者又利用Evol Instruction生成了很多数学领域相关的指令,然后微调羊驼大模型,得到了WizardMath。

其效果如开头所示,在GSM8k数据集上测得其数学能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一众大模型,位列第5名,仅次于GPT-4、Claud1.3和2.0,以及5400亿参数的Flan-PaLM 2之后。

以此类推,作者还在羊驼之上得到了专攻代码能力的WizardCoder,效果超越Claude和Bard(详情可戳文末地址)。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

团队介绍本文共9位作者,全华人。

一作有3位:

Can Xu,微软亚洲互联网工程院S+D NLP组高级应用科学家,之前曾在微软小冰研究组和微软亚研院从事聊天机器人系统工作;

Qingfeng Sun, Microsoft Research科学家,研究方向为自然语言处理和信息检索,精通构建高效搜索系统,为Microsoft Bing和Office 365贡献了核心深度模型;

Kai Zheng,Microsoft Research科学家,研究方向为自然语言处理、搜索和推荐排名,同样为Microsoft Bing和Office 365贡献了核心深度模型。

数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

通讯作者为姜大昕,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家,在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,日前已被曝离职投身大模型创业。

另还有一位作者Jiazhan Feng,是北大学生,这篇合著论文是TA在微软实习时产出的。

项目主页: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

责任编辑:宪瑞

以上就是手游巴士为您提供《数学能力超ChatGPT 70B开源大模型火了:用AI微调AI》的详细内容,更多精彩内容请继续阅读上一篇《《宝可梦:大集结》将有新角色登场 火焰鸡、谜拟Q及魔幻假面喵》

表羞涩嘛~喜欢就点我

分享吧~提高逼格:

相关阅读

  • 2023-08-14 《宝可梦:大集结》将有新角色登场 火焰鸡、谜拟Q及魔幻假面喵

  • 2023-08-14 航拍对比夏威夷毛伊岛火灾前后:港湾一片灰黑

  • 2023-08-14 《宝可梦》官方宣称将放缓游戏上新速度 确保每一部质量

  • 2023-08-14 数学能力超ChatGPT 70B开源大模型火了:用AI微调AI

  • 2023-08-14 福利很甜,联动真香!《王牌竞速》二周年庆典x联动好礼再加码

  • 2023-08-14 《未定事件簿》手游×浙江省博物馆联动开启 古韵遗珍,携手同游

  • 2023-08-14 系列十年最大变革:苹果明年将推出“Watch X”手表

  • 2023-08-14 小米MIX Fold 3等4大新品外 雷军预告今晚还有惊喜:一大一小

  • 2023-08-14 纯电飞艇2030年问世

  • 2023-08-14 纯电飞艇2030年问世

  • 2023-08-14 钱包预警!盘点今年还未发售的知名大作

  • 2023-08-14 国内油价下周三迎来调整!预计涨0.09-0.10元/升

  • 2023-08-14 这款“读博模拟器”太逼真!玩过的人都要崩溃了:你敢试试?

  • 2023-08-14 18秒就能充满电?!再也不用担心出门手机没电了

  • 2023-08-14 女大学生时隔3年回老家 开门发现院子长满竹子 已成蛇的天堂

  • 2023-08-14 离谱!男子吃菌产生驾车撞人幻觉后自首 结果虚惊一场

  • 2023-08-14 造车梦圆!贾跃亭亲手交付首辆法拉第未来FF 91 2.0

  • 2023-08-14 售价3000元/张 国铁回应60岁以上老人高铁年票:已打折 可按需购买

  • 2023-08-14 国庆档已有8部新片定档:张艺谋首部犯罪悬疑电影《坚如磐石》来了

  • 2023-08-14 17万买丰田纯电SUV 5天3次打不着火需换电瓶:车主不干了

  • 2023-08-14 一张顶三张 擦得更干净:德佑湿厕纸巾80抽6.9元大促

  • 2023-08-14 狂揽35亿票房!电影《消失的她》秘钥延期9月21日

  • 2023-08-14 电池可充可换 配备高精自动驾驶 红旗智能电轿E001官图曝光

  • 2023-08-14 拼多多盯上了日本韩国 但这次好像有点砍不动

  • 2023-08-14 售价超过500元!动视官方:《COD 20》不是DLC转正

热点推荐

  • 《未定事件簿》手游×浙江省博物馆联动开启 古韵遗珍,携手同游《未定事件簿》手游×浙江省博物馆联动开启 古韵遗珍,携手同游
  • 《​飞吧龙骑士》公测上线送150抽,暑期档清流,小团团力荐!《​飞吧龙骑士》公测上线送150抽,暑期档清流,小团团力荐!
  • 《阴阳师》×动画《雾山五行》联动PV公开,全新联动角色闻人翊悬亮相!《阴阳师》×动画《雾山五行》联动PV公开,全新联动角色闻人翊悬亮相!
  • 《梦幻西游三维版》年度首个新版本开启!全新角色【虎头怪】重磅来袭《梦幻西游三维版》年度首个新版本开启!全新角色【虎头怪】重磅来袭

热门游戏

  • 时逆

    时逆

    立即下载
  • 剑侠世界

    剑侠世界

    立即下载
  • 铁甲风暴

    铁甲风暴

    立即下载
  • 三国志奇侠传

    三国志奇侠传

    立即下载
  • 蜀山战神

    蜀山战神

    立即下载
  • 人气动漫大乱斗

    人气动漫大乱斗

    立即下载

热点资讯

更多+
  • 啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
    啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
  • 轩辕剑之汉之云手游双属性职业阴阳战斗玩法
    轩辕剑之汉之云手游双属性职业阴阳战斗玩法
  • 莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上
    莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上

小编热推

更多+
每一片大海都有自己的MBTI!来《天谕》手游共赏奇妙美景!

满分攻略

  • 箭头消消消8.14第二关怎么过 8.14第二关过关答案

    满分 箭头消消消8.14第二关怎么过 8.14第二关过关答案

    02关
    查看全部
  • 箭头消消消8.14怎么消除相对箭头 8.14第二关过关答案

    满分 箭头消消消8.14怎么消除相对箭头 8.14第二关过关答案

    02关
    查看全部
  • 崩坏星穹铁道地城探宝遗迹二深层怎么打 地城探宝第二遗迹深层通关攻略

    满分 崩坏星穹铁道地城探宝遗迹二深层怎么打 地城探宝第二遗迹深层通关攻略

    02关
    查看全部

热门礼包

更多+

三国杀

三国杀 剩余:500/500 有效日期:2017-05-02

领取

三国杀

领取

三国杀愚人节礼包

三国杀愚人节礼包 剩余:500/500 有效日期:2017-05-31

领取

三国杀愚人节礼包

领取

三国杀独家礼包

三国杀独家礼包 剩余:500/500 有效日期:2017-07-26

领取

三国杀独家礼包

领取

三国杀移动版国庆礼包

三国杀移动版国庆礼包 剩余:500/500 有效日期:2017-11-29

领取

三国杀移动版国庆礼包

领取

一步高升新手礼包

一步高升新手礼包 剩余:491/1000 有效日期:2019-09-14

领取

一步高升新手礼包

领取

奶块首发大礼包

奶块首发大礼包 剩余:344/1900 有效日期:1970-01-01

领取

奶块首发大礼包

领取

奶块成长礼包

奶块成长礼包 剩余:297/1167 有效日期:2017-12-31

领取

奶块成长礼包

领取

植物大战僵尸2特权礼包

植物大战僵尸2特权礼包 剩余:232/300 有效日期:2018-05-31

领取

植物大战僵尸2特权礼包

领取

银河战舰代言人公测礼包

银河战舰代言人公测礼包 剩余:232/300 有效日期:2018-10-01

领取

银河战舰代言人公测礼包

领取

植物大战僵尸2豪华福包

植物大战僵尸2豪华福包 剩余:227/500 有效日期:2018-07-31

领取

植物大战僵尸2豪华福包

领取

热门合集

更多+
  • 适合女生玩的HTML5游戏

    查看合集
  • 2017手机游戏排行榜

    查看合集

手游资讯

NEWS
手游行业 手游活动 新游前瞻 综合资讯

最全攻略

RAIDERS
游戏资料 游戏攻略 硬件资讯 游戏问答

视频中心

VIDEO
视频攻略 新游预告 热门游戏 周边视频

游戏中心

GAME
手游合集 游戏分类 发号中心 热门专区

手游排行

TOP 100
安卓榜 苹果榜 单机榜 网游榜

手游巴士

手游巴士

  • 关于我们
  • 商务洽谈
  • 联系我们
  • 友情链接
  • 版权声明

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号