首页全站导航手机版加入收藏关注我们
全站导航
  • 手游行业
  • 游戏问答
  • 新游前瞻
  • 游戏动态
  • 视频攻略
  • 新游预告
  • 热游视频
  • 周边视频
  • 资讯中心
  • 游戏攻略
  • 礼包中心
  • 热门攻略
  • 游戏专区
  • 手游合集
  • 手游分类
  • 手游开服
  • 手游开测
  • 全部手游
  • 苹果排行
  • 安卓排行
  • 单机排行
  • 网游排行
  • 福利美图
  • 吐槽八卦
  • 内涵GIF
  • 游戏截图
  • 游戏壁纸
关注我们
手游巴士

资讯

  • 资讯
  • 游戏
  • 视频
  • 礼包
  • 图片
  • 首页
  • 游戏中心
  • 手游行业
  • 新游资讯
  • 新游预告
  • 游戏活动
  • 综合资讯
  • 硬件资讯
  • 游戏攻略
  • 游戏评测
当前位置:首页 > 手游资讯 > 其他 > 史上首次,强化学习算法控制核聚变登上 Nature:DeepMind 让人造太阳向前一大步

史上首次,强化学习算法控制核聚变登上 Nature:DeepMind 让人造太阳向前一大步

2022-02-18 08:19 来源:机器之心 作者:佚名

用手机看

扫描二维码随身看资讯 使用手机 二维码应用 扫描右侧二维码,您可以
1.在手机上细细品读~
2.分享给你的微信好友或朋友圈~

来源:机器之心

过去三年,DeepMind 和瑞士洛桑联邦理工学院 EPFL 一直在进行一个神秘的项目:用强化学习控制核聚变反应堆内过热的等离子体,如今它已宣告成功。

DeepMind 研究科学家 David Pfau 在论文发表后感叹道:「为了分享这个时刻我已经等了很久,这是第一次在核聚变研究设备上进行深度强化学习的演示!」

可控核聚变、强人工智能、脑机接口是人类科技发展的几个重要方向,有关它们何时可以实现,科学家们的说法永远是「还需几十年」——面临的挑战太多,手头的方法却很有限。

那么用人工智能去控制核聚变,是不是一个有前途的方向?这个问题可能需要由提出 AlphaGo 的 DeepMind 来回答了。

最近,EPFL 和 DeepMind 使用深度强化学习控制托卡马克装置等离子体的研究登上了《自然》杂志。

论文地址:https://www.nature.com/articles/s41586-021-04301-9

首先,我们来思考一个问题:为什么要用人工智能控制核聚变?

托卡马克是一种用于容纳核聚变反应的环形容器,其内部呈现出一种特殊的混乱状态。氢原子在极高的温度下被挤压在一起,产生比太阳表面还热的、旋转的、翻滚的等离子体。找到控制和限制等离子体的方法将是释放核聚变潜力的关键,而后者被认为是未来几十年清洁能源的源泉。

在这一点上,科学原理似乎是说得通的,剩下的就是工程挑战。参与该研究的瑞士等离子体中心(SPC)主任 Ambrogio Fasoli 表示:「我们需要能够加热这个装置,并保持足够长的时间,以便我们从中吸取能量。」

在同样由聚变驱动的恒星中,仅依靠引力质量就足以将氢原子拉到一起并克服它们的相反电荷。在地球上,科学家们改为使用强大的磁线圈来限制核聚变反应,将其推到所需的位置。这些线圈必须仔细控制,以防止等离子体接触容器本身:这会损坏容器壁并减慢聚变反应。

但每次研究人员想要改变等离子体的配置并尝试不同的形状,以产生更多的能量或更纯净的等离子体时,都需要大量的工程和设计工作。传统的系统是由计算机控制的,基于模型和模拟,但 Fasoli 表示传统方法「复杂且不一定能起到优化的作用」。

DeepMind 控制团队负责人 Martin Riedmiller 表示:「人工智能,特别是强化学习,特别适合解决托卡马克中控制等离子体的复杂问题。」DeepMind 在论文中详细介绍了所提的可以自主控制等离子体的 AI。

技术概览

DeepMind 提出的模型架构如下图所示,该方法具有三个阶段:

第一阶段:设计者为实验指定目标,可能伴随着随时间变化的控制目标;

第二阶段:深度 RL 算法与托卡马克模拟器交互,以找到接近最优的控制策略来满足指定目标;

第三阶段:以神经网络表示的控制策略直接在托卡马克硬件上实时运行(零样本)。

图 1:控制器设计架构(controller design architecture)的各组件示意图。

在第一阶段,实验目标由一组目标指定,这些目标包含不同的期望特性。特性范围包括位置和等离子体电流的基本稳定,以及多个时变目标的复杂组合。然后,这些目标被组合成一个奖励函数,在每个时间步骤中为状态分配一个标量质量度量。该奖励函数还惩罚控制策略,让其不会达到终端状态。至关重要的是,精心设计的奖励函数将被最低限度地指定,从而为学习算法提供最大的灵活性以达到预期的结果。

在第二阶段,高性能 RL 算法通过与环境交互来收集数据并找到控制策略,如图 1a、b 所示。该研究使用的模拟器具有足够的物理保真度来描述等离子体形状和电流的演变,同时保持足够低的计算成本来学习。具体来说,该研究基于自由边界等离子体演化(free-boundary plasma-evolution )模型,对等离子体状态在极向场线圈电压的影响下的演化进行建模。

RL 算法使用收集到的模拟器数据来找到关于指定奖励函数的最优策略。由于演化等离子体状态的计算要求,模拟器的数据速率明显低于典型 RL 环境的数据速率。该研究通过最大后验策略优化 ( MPO ) 来克服数据不足问题。MPO 支持跨分布式并行流的数据收集,并以高效的方式进行学习。

在第三阶段,控制策略与相关的实验控制目标绑定到一个可执行文件中,使用量身定制的编译器(10 kHz 实时控制),最大限度地减少依赖性并消除不必要的计算。这个可执行文件是由托卡马克配置变量(TCV)控制框架加载的(图 1d)。每个实验都从标准的等离子体形成程序(plasma-formation procedures)开始,其中传统控制器维持等离子体的位置和总电流。在预定时间里,称为「handover」,控制切换到控制策略,然后启动 19 个 TCV 控制线圈,将等离子体形状和电流转换为所需的目标。训练完成后将不会进一步调整网络权值,换句话说,从模拟到硬件实现了零样本迁移。

基本功能演示

该研究在 TCV 实验中展示了所提架构在控制目标上的能力。首先他们展示了对等离子体平衡基本质量的精确控制。控制策略性能如图 2 所示。所有任务都成功执行,跟踪精度低于期望的阈值。结果表明 RL 体系架构能够在放电实验的所有相关阶段进行精确的等离子体控制。

图 2:等离子体电流、垂直稳定性、位置与形状控制的演示。

控制演示

接下来,该研究展示了所提架构为科学研究生成复杂配置的能力。结果如图 3 所示:

图 3 控制演示。

全新多域等离子体演示

最后展示了架构在探索全新等离子配置方面的强大功能。DeepMind 测试了「液滴」(droplets)的控制,这是一种在容器内部同时存在两个独立等离子体的配置。通过提出的方法,DeepMind 简单地调整了模拟切换状态,以考虑来自单轴等离子体的不同切换条件,并定义一个奖励函数以保持每个液滴组件的位置稳定,同时增加域等离子体电流。

图 4:整个 200 毫米控制窗口内对 TCV 上两个独立液滴的持续控制演示。

未来展望

总而言之,随着聚变反应堆变得越来越大,与 DeepMind 展开合作或许是最关键的。尽管物理学家已经很好地掌握了如何通过传统方法控制小型托卡马克中的等离子体,但随着科学家们尝试令核电站规模的版本可行,挑战只会更多。该领域正取得缓慢但稳定的进展。

上周,位于英国牛津郡的欧洲联合环状反应堆(JET)项目取得了突破,创造了从聚变实验中提取能量的新纪录,在 5 秒时间内产生了 59 兆焦耳的能量。与此同时,位于法国的国际热核聚变实验反应堆(ITER)国际合作项目正在建设当中,预计将于 2025 年启动并成为世界上最大的实验性聚变反应堆。

圣地亚哥能源研究中心的副研究科学家 Dmitri Orlov 表示,「托卡马克装置越复杂,性能越高,就越需要通过越来越高的可靠性和准确性来控制更多数量。」AI 控制的托卡马克装置可以通过优化,以控制热量从反应中转移到容器壁上,并防止破坏性的「等离子体不稳定性」。反应堆本身可以重新设计,以利用强化学习所提供的更严格控制。

最终,Ambrogio Fasoli 认为,与 DeepMind 的合作可以让研究人员突破界限,加速通往聚变能量的漫长旅程。人工智能将赋能我们探索人类无法探索的东西,因为我们可以使用自己不敢冒险的控制系统来达到目标。「如果我们确定自己有一个控制系统,让我们接近极限但不会超出极限,则实际上可以用来探索那些不存在的可能性。」

以上就是手游巴士为您提供《史上首次,强化学习算法控制核聚变登上 Nature:DeepMind 让人造太阳向前一大步》的详细内容,更多精彩内容请继续阅读上一篇《为 K50 电竞版让路!Redmi 上代旗舰 K40 游戏增强版降价:顶配版卖 1899 元》

表羞涩嘛~喜欢就点我

分享吧~提高逼格:

相关阅读

  • 2022-02-18 史上首次,强化学习算法控制核聚变登上 Nature:DeepMind 让人造太阳向前一大步

  • 2022-02-18 iPad Air 5 曝光?或在 3 月与 iPhone SE3 一起发布

  • 2022-02-18 上线一个月就超越微信和 QQ,啫喱究竟有什么魔力

  • 2022-02-18 小米王腾:Redmi K50 标准版将在 3 月份发布

  • 2022-02-18 Windows 11 大更新:Android 应用使用更方便,还有这些新变化

  • 2022-02-18 AirPods 电池老化只能丢?国人研发无损换电池满血复活

  • 2022-02-18 绝对不降噪,最强通透模式!索尼 LinkBuds 开放式耳机首发评测

  • 2022-02-18 为 K50 电竞版让路!Redmi 上代旗舰 K40 游戏增强版降价:顶配版卖 1899 元

  • 2022-02-17 七度空间卫生巾有虫卵品牌赔500 系其他渠道购买

  • 2022-02-17 男子赠与小三财产妻子起诉赠与无效 结局令人意想不到

  • 2022-02-17 成品油涨价加满一箱油多花8元 年内连续三次上涨

  • 2022-02-17 微粒贷开通不用会怎么样 额度会被降低吗

  • 2022-02-17 香港疫情外溢多地发举报偷渡悬赏 珠海奖励10万

  • 2022-02-17 农行网捷贷申请条件是什么 容易通过吗?

  • 2022-02-17 瑞幸客服回应涨价 是这些因素影响导致!

  • 2022-02-17 15人从香港偷渡内地有4人确诊 香港疫情严重

  • 2022-02-17 高亭宇蹦上领奖台 跳得比当年刘翔高:夺冠后仰天怒吼上热搜 网友点赞

  • 2022-02-17 美财长:对俄制裁势必影响全球 会放弃制裁吗

  • 2022-02-17 法院辟谣张卫健涉电信诈骗被抓 真相是这样的

  • 2022-02-17 离职了社保如何续交 通过这两种方法来解决

  • 2022-02-17 社保转移到异地怎样操作 流程是这样的

  • 2022-02-17 商务部回应印度禁用54款中国App 损害中企权益

  • 2022-02-17 退休人员能贷款吗 要哪些条件

  • 2022-02-17 网上基金定投怎么办理 有风险吗

  • 2022-02-17 有疾病的能加入相互宝吗 加入的条件是什么

热点推荐

热门游戏

  • 时逆

    时逆

    立即下载
  • 剑侠世界

    剑侠世界

    立即下载
  • 铁甲风暴

    铁甲风暴

    立即下载
  • 三国志奇侠传

    三国志奇侠传

    立即下载
  • 蜀山战神

    蜀山战神

    立即下载
  • 人气动漫大乱斗

    人气动漫大乱斗

    立即下载

热点资讯

更多+
  • 啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
    啪啪三国2手游枪兵好玩吗?枪兵作战有什么特色
  • 轩辕剑之汉之云手游双属性职业阴阳战斗玩法
    轩辕剑之汉之云手游双属性职业阴阳战斗玩法
  • 莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上
    莽荒纪3D手游新手必备 浩瀚世界里的修仙小伙伴上

小编热推

更多+
新年“第一桶金”《暗区突围》手游“月圆之夜”主题活动

满分攻略

  • 双生幻想洛可可剧情挑战第三章3-2通关攻略

    满分 双生幻想洛可可剧情挑战第三章3-2通关攻略

    关
    查看全部
  • 双生幻想洛可可剧情挑战第三章3-1通关攻略

    满分 双生幻想洛可可剧情挑战第三章3-1通关攻略

    关
    查看全部
  • 炉石传说佣兵之书布鲁坎第二关怎么过

    满分 炉石传说佣兵之书布鲁坎第二关怎么过

    02关
    查看全部

热门礼包

更多+

三国杀

三国杀 剩余:500/500 有效日期:2017-05-02

领取

三国杀

领取

三国杀愚人节礼包

三国杀愚人节礼包 剩余:500/500 有效日期:2017-05-31

领取

三国杀愚人节礼包

领取

三国杀独家礼包

三国杀独家礼包 剩余:500/500 有效日期:2017-07-26

领取

三国杀独家礼包

领取

三国杀移动版国庆礼包

三国杀移动版国庆礼包 剩余:500/500 有效日期:2017-11-29

领取

三国杀移动版国庆礼包

领取

一步高升新手礼包

一步高升新手礼包 剩余:491/1000 有效日期:2019-09-14

领取

一步高升新手礼包

领取

奶块首发大礼包

奶块首发大礼包 剩余:343/1900 有效日期:1970-01-01

领取

奶块首发大礼包

领取

奶块成长礼包

奶块成长礼包 剩余:296/1167 有效日期:2017-12-31

领取

奶块成长礼包

领取

银河战舰代言人公测礼包

银河战舰代言人公测礼包 剩余:232/300 有效日期:2018-10-01

领取

银河战舰代言人公测礼包

领取

植物大战僵尸2特权礼包

植物大战僵尸2特权礼包 剩余:230/300 有效日期:2018-05-31

领取

植物大战僵尸2特权礼包

领取

我有上将新手礼包

我有上将新手礼包 剩余:218/254 有效日期:2017-12-31

领取

我有上将新手礼包

领取

热门合集

更多+
  • 适合女生玩的HTML5游戏

    查看合集
  • 2017手机游戏排行榜

    查看合集

手游资讯

NEWS
手游行业 手游活动 新游前瞻 综合资讯

最全攻略

RAIDERS
游戏资料 游戏攻略 硬件资讯 游戏问答

视频中心

VIDEO
视频攻略 新游预告 热门游戏 周边视频

游戏中心

GAME
手游合集 游戏分类 发号中心 热门专区

手游排行

TOP 100
安卓榜 苹果榜 单机榜 网游榜

手游巴士

手游巴士

  • 关于我们
  • 商务洽谈
  • 联系我们
  • 友情链接
  • 版权声明

Copyright © 2020-2022 手游巴士 shouyoubus.com, All Rights Reserved.赣ICP备2021011040号