快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本

图片

来源:ScienceAI

编辑:2049

在聚变能源研究领域,等离子体动力学模拟扮演着关键角色。然而,非线性 Fokker-Planck-Landau(FPL)碰撞算子的计算成本极高,尤其在全托卡马克体积建模中,其计算时间随等离子体粒子种类数量 n 呈 O(n²) 增长,严重制约了模拟效率。

为突破这一瓶颈,来自蔚山国立科学技术院(UNIST)的研究人员开发了一种全新的深度学习框架——FPL-net,利用人工智能技术加速求解这一复杂问题。

FPL-net 获得结果的速度比以前的方法快 1,000 倍,误差幅度仅为十万分之一,表现出卓越的准确性。

该研究以「FPL-net:A deep learning framework for solving the nonlinear Fokker-Planck-Landau collision operator for anisotropic temperature relaxation」为题,于 2025 年 2 月 15 日发布在《Journal of Computational Physics》上。

图片

论文链接:https://doi.org/10.1016/j.jcp.2024.113665

相关报道:https://phys.org/news/2025-02-deep-boosts-plasma-nuclear-fusion.html

研究背景

在托卡马克聚变装置中,非线性 Fokker-Planck 方程是描述等离子体碰撞过程的关键数学工具。传统上,这一方程可表示为 Landau 形式或 Rosenbluth 形式的积分微分方程,两种形式都需要复杂的数值方法求解。

尽管研究人员开发了多种数值方法以确保质量、动量和能量守恒,但由于碰撞算子的非线性特性,其计算速度依然远低于线性算子,成为等离子体模拟中的计算瓶颈。

FPL-net:突破性的深度学习解决方案

FPL-net 的核心是一个经过优化的全卷积神经网络,采用了 U-Net 架构作为骨干网络。

U-Net 最初为生物医学图像分割领域设计,由一个捕获输入图像上下文的编码器和一个负责精确定位和高分辨率的解码器组成。

这种编码器-解码器架构能够保持输入输出尺寸一致,保留高分辨率局部信息,并且在相对较小的模型规模下实现强大性能。

图片

图示:以二维速度网格信息作为输入的任意 PDF fN 的 FPL-net 示意图。(来源:论文)

FPL 方程可以用以下形式表示:

图片

其中,a 和 b 代表不同粒子种类,f 表示概率分布函数,C_ab 表示 a 和 b 之间的碰撞算子(在各自 v 和 v' 坐标系中),e、m、ε₀ 和 lnΛ 分别是电荷、质量、真空介电常数和库仑对数。张量 U 定义为:

图片

其中 u = v - v' 是相对速度矢量,I 为单位张量。

图片

图示:训练过程概述。(来源:论文)

研究团队使用传统 FPL 求解器生成训练数据,该求解器采用有限体积法和 Picard 迭代方案,在二维速度网格上实现电子等离子体模拟,网格尺寸为垂直轴(N⊥)和平行轴(N∥)均为 N⊥×N∥=40×60。

为确保模型的泛化能力,研究人员准备了 115 种不同的各向异性初始温度条件数据,平行轴温度(T∥)与垂直轴温度(T⊥)的比值范围从 0.71 到 2.19,密度固定为 ne = 1.0×10¹⁹/m³,垂直温度 T⊥ = 100 eV。每个时间步长设置为碰撞时间的十分之一,每种条件下的模拟执行了 200 个时间步长。

FPL-net 的输入是一个三通道张量,由任意初始条件下的分布函数 fN 和二维速度网格(v⊥ 和 v∥)组成,尺寸为 40×60×3。通过堆叠分布函数和速度网格,模型能够学习与分布函数相关的速度几何信息,从而保持动量和能量守恒。

模型输出库仑碰撞导致的分布函数变化 ΔfML_N,这是一个尺寸为 40×60 的单通道张量。通过将输入 fN 和输出 ΔfML_N 相加,可以预测下一时间步的分布函数 fML_N+1。

物理守恒约束与训练过程

FPL-net 的独特之处在于如何处理物理守恒定律。研究团队实现了基于动力学理论统计物理中分布函数矩的物理守恒约束:

图片

基于这些定义,团队使用三个守恒损失函数:

图片

总体物理信息损失函数为:

图片

其中 λ 是可变超参数,代表守恒损失在总损失函数中的权重,初始值为 0,在 600 个 epoch 内线性增加到 0.5,之后保持固定。

图片

图示:模型评估过程的流程图。(来源:论文)

更重要的是,FPL-net 被训练为递归预测两个未来时间步,通过使用前一输出作为后续输入,显著提高了长期模拟的稳定性。最终损失为这两个时间步损失之和:L = L^{N+1} + L^{N+2}。这种训练策略确保了模型在连续时间序列模拟中的鲁棒性。

实验结果与性能突破

经过测试,FPL-net 在保持误差控制在 10⁻⁵ 量级的同时,展现出卓越的计算效率。在测试数据集上的 2189 个测试案例中,密度误差平均为 9.82×10⁻⁶,中位数为 7.81×10⁻⁶;动量误差平均为 5.46×10⁻⁶,中位数为 4.27×10⁻⁶;能量误差平均为 2.85×10⁻⁵,中位数为 2.13×10⁻⁵。

图片

图示:来自总共 2189 个测试用例的密度(左)、动量(中)和能量(右)误差分布的直方图。(来源:论文)

FPL-net 成功实现了完整的温度松弛,这是深度学习模型首次在此领域取得的突破。在初始条件 T∥/T⊥=0.795 的温度松弛实验中,与基于 Picard 迭代碰撞代码得出的真实数据相比,双麦克斯韦松弛展现出显著一致性,在 199 个时间步内差异最大仅为 3.3%。

图片

图示:在 T∥/T⊥ = 0.795 的初始温度条件下,温度弛豫实验在 199 个时间步长中的结果。黑色实线对应于真实数据,而红色(蓝色)虚线表示从 FPL-net 结果得出的 v∥ (v⊥) 温度。(来源:论文)

研究团队还进行了两项额外实验验证模型的稳健性。

在延长推演测试中,模型预测长度扩展至 1200 个时间步(训练长度的六倍),结果表明误差在 1000 个时间步内保持在可接受范围,温度与真实值紧密匹配。

在高斯噪声测试中,向输入添加了相当于输入标准差 1%、2.5% 和 5% 的噪声,结果显示噪声水平不超过 2.5% 时,误差不会随时间步增长而发散,温度松弛能够成功实现。

图片

图示:使用随机噪声的 FPL-net 预测。(来源:论文)

在计算效率方面,FPL-net 在单个 NVIDIA RTX A5000 GPU 上,每个时间步的平均推理时间为 3.56 毫秒,内存占用为 63.82 MB。

而用于数据生成的 Picard 迭代碰撞算子在 Intel Xeon Silver 4112 CPU 上,每个时间步平均需要 4135 毫秒,使用 1017 MB 内存。

这意味着 FPL-net 相比传统数值方法实现了 1000 倍以上的加速。

未来展望与挑战

FPL-net 作为应用深度学习于等离子体碰撞模拟的典范,证明了如何在保持高精度的同时显著降低计算成本。这种计算加速使研究人员能更高效地利用有限资源,加速等离子体研究进程,同时为数字孪生托卡马克和全装置建模提供了必要支持。

然而,该研究仍存在明显局限性:FPL-net 目前仅能模拟电子等离子体,不包含主要离子;初始分布函数仅限于双麦克斯韦分布。未来研究将致力于发展包含多粒子种类的碰撞算子,并扩展至各种初始分布函数,以增强其在聚变领域的实际应用价值。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

8ff218aae598df771dd5f77727b8c29a.jpeg

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。

30c3053d7e610fc1f176c6b5f45f4537.jpeg

截止到2月28日 ”未来知识库”精选的100部前沿科技趋势报告

  1. 《核聚变,确保 21 世纪美国的主导地位的关键技术》

  2. 《世界知识产权组织:2025WIPO 技术趋势报告:交通运输的未来(145 页)》

  3. 《世界知识产权组织(WIPO):2024 年世界知识产权指标报告(194 页)》

  4. 《联合国环境规划署:2024 年保护地球报告(81 页)》

  5. 《联合国工发组织:2024 清洁技术创新能力建设框架研究报告(51 页)》

  6. 《凯捷:Applying TechnoVision 2025:未来科技趋势及应用愿景(17 页)》

  7. 《谷歌:2025 年 AI Agent 白皮书:AI 智能体时代来临(42 页)》

  8. 《富而德律师事务所:2024 年国际仲裁趋势年度回顾报告(41 页)》

  9. 《邓白氏:2024 年全球企业破产报告(27 页)》

  10. 《LLM 时代小模型的应用潜力与挑战 》(50 页)

  11. 《斯坦福 2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告》(英文版 191 页)

  12. 《英伟达:2025NVIDIA 自动驾驶安全报告(26 页)》

  13. 《微软 MICROSOFT (MSFT) 2024 年影响力摘要报告(23 页)》

  14. 《高德地图:2024 年中国主要城市交通分析报告(29 页)》

  15. 《德勤 & CAS:2025 锂离子电池回收行业报告 - 面向绿色未来的市场及创新趋势(36 页)》

  16. 《ABI Research:2025 生成式人工智能在语义和实时通信中的应用研究报告(20 页)》

  17. 《2025 年 3D 打印技术发展趋势、产业链及相关标的分析报告(45 页)》

  18. 《生成式基础模型的可信度 —— 指南、评估与展望》(231 页)

  19. 《量子信息科学与技术对国家安全的影响》(118 页)

  20. 《中国科学技术信息研究所:2024 科技期刊世界影响力指数(WJCI)报告(68 页)》

  21. 《思略特(Strategy&):2025 汽车行业的人工智能(AI)机遇研究报告(12 页)》

  22. 《赛默飞:2024 年中国生物科技行业调研报告:资本寒冬中生物科技企业的生产之道(18 页)》

  23. 《清华大学:2025 年 DeepSeek 与 AI 幻觉报告(38 页)》

  24. 《美国企业研究所(AEI):2025 创新未来电力系统研究报告:从愿景迈向行动(71 页)》

  25. 《超材料的智能设计研究进展》

  26. 《Ember:2030 年全球可再生能源装机容量目标研究报告(29 页)》

  27. 《量子信息科学与技术对国家安全的影响》

  28. 《英国人工智能安全研究所:2025 年国际人工智能安全报告 - 执行摘要(22 页)》

  29. 《世界海事大学:2024 海事数字化与脱碳研究报告:可持续未来(250 页)》

  30. 《艾睿铂(AlixPartners):2024 回溯过往锚定未来:大型科技公司如何推进人工智能愿景研究报告(18 页)》

  31. 《Wavestone :2025 数据与 AI 雷达:掌握数据与人工智能转型的 10 大挑战研究报告(30 页)》

  32. 《CSIS:2024 中美学术的再联结研究报告:在激烈竞争的时代增进相互理解(120 页)》

  33. 《MSC:2025 全球国防创新就绪度差距系列报告:突破制约国防创新的六大隐性障碍(第四版)(32 页)》

  34. 《2025 年 AI 编程发展前景及国内外 AI 编程应用发展现状分析报告(22 页)》

  35. 《中国核电 - 公司深度报告:世界核电看中国 - 250218(22 页)》

  36. 《医药生物行业:医疗器械行业全景图发展趋势及投资机会展望 - 250216(28 页)》

  37. 《皮尤研究中心:2024 美国社交媒体使用情况研究报告(英文版)(30 页)》

  38. 《科睿唯安:2025 基因编辑领域的领先创新者洞察报告 - 改变药物发现和开发范式的八大创新者(47 页)》

  39. 《经合组织(OECD):2025 年全球脆弱性报告(218 页)》

  40. 《计算机行业年度策略:AI 应用元年看好 Agent、豆包链及推理算力三大主线 - 250218(38 页)》

  41. 《国金证券研究所:从理想走向现实,全球人型机器人研究报告》

  42. 《深度解读 DeepSeek 原理与效应(附 PPT 下载)》

  43. 《兰德公司(RAND):2025 借鉴危机经验构建城市水安全韧性研究报告:五城案例分析(62 页)》

  44. 《凯捷(Capgemini):2025 行业创新洞察:电气化飞机推进系统研究报告(27 页)》

  45. 《国际能源署(IEA):2025 全球电力市场报告:至 2027 年的分析与预测(200 页)》

  46. 《Zenith:2025 年国际消费电子展(CES)趋势报告:AI 对消费科技、消费行为及传媒营销的变革性影响(17 页)》

  47. 《RBC 财富管理:全球透视 2025 年展望报告(33 页)》

  48. 《美国国防部和国家安全领域的十大新兴技术》(96 页)

  49. 《代理型人工智能全面指南》(45 页 ppt)

  50. 《麦肯锡 2025 人类工作中的超级代理。赋能人类解锁 AI 的全部潜力》(英文版 47 页)

  51. 《仲量联行(JLL):2025 美国制造业的复兴全面分析报告:未来制造业增长及工业需求前瞻(26 页)》

  52. 《未来的太空领域:影响美国战略优势的领域》

  53. 《Luminate:2024 年年终美国影视行业报告:数据及趋势洞察(40 页)》

  54. 《Anthropic:2025 年 AI 经济影响报告:AI 如何融入现代经济的各类实际任务(38 页)》

  55. 【ICLR2025】《LLMS 能否识别您的偏好?评估 LLMS 中的个性化偏好遵循能力》

  56. 《改进单智能体和多智能体深度强化学习方法》(219 页)

  57. 《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考通用人工智能 AGI 的多元路径探索研究报告》(英文版 29 页)

  58. 《世界经济论坛 & 麦肯锡:2025 以人才为核心:制造业持续变革的当务之急研究报告(40 页)》

  59. 《超越 ChatGPT 的 AI 智能体》(82 页 ppt)

  60. 《Harris Poll:2024 年汽车技术预测报告:消费者对先进汽车技术与功能的洞察(14 页)》

  61. 【新书】《人工智能智能体的应用》(527 页)

  62. 《哥伦比亚大学:超越 Chatgpt 的 AI agent 综述》

  63. 《欧盟标准组织 - 体验式网络智能(ENI)- 基于人工智能代理的下一代网络切片研究》

  64. 《中国科学院:2024 开放地球引擎(OGE)研究进展与应用报告(55 页)》

  65. 《中国工程院:2024 农业机器人现状与展望报告(70 页)》

  66. 《美国安全与新兴技术中心:2025 中国学界对大语言模型的批判性思考:通用人工智能 (AGI) 的多元路径探索研究报告(29 页)》

  67. 《罗兰贝格:2050 年全球趋势纲要报告之趋势五:技术与创新(2025 年版)(72 页)》

  68. 《理特咨询(ADL):2025 解锁聚变能源:驾驭聚变能商业化的机遇与挑战研究报告(20 页)》

  69. 《埃森哲:技术展望 2025—AI 自主宣言:可能无限信任惟先 - 摘要(12 页)》

  70. 《怡安(AON):2025 年气候和自然灾难洞察报告(109 页)》

  71. 《美国安全与新兴技术中心:2025 AI 翻车事故(AI incident):强制性报告制度的关键要素研究报告(32 页)》

  72. 《牛津经济研究院 2025 确保英国充分释放量子计算的经济潜力研究报告 》(英文版 64 页)

  73. 《欧洲创新委员会(EIC):2024 年科技报告(65 页)》

  74. 《大模型基础 完整版》

  75. 《国际人工智能安全报告》(300 页)

  76. 《怡安(AON):2025 年全球医疗趋势报告(19 页)》

  77. 《前瞻:2025 年脑机接口产业蓝皮书 —— 未来将至打造人机交互新范式(57 页)》

  78. 《联合国(United Nations):2024 技术与统计报告:从业者投资法指南(67 页)》

  79. 《经济学人智库(EIU):2025 全球展望报告:特朗普再次当选美国总统的全球影响(16 页)》

  80. 《大规模视觉 - 语言模型的基准、评估、应用与挑战》

  81. 《大规模安全:大模型安全的全面综述》

  82. 《Emplifi:2024 年 Q4 全球电商行业基准报告 - 社交媒体趋势洞察(37 页)》

  83. 《DeepMind:2025 生成式魂灵:预测人工智能来世的益处和风险研究报告(23 页)》

  84. 【AI4Science】《利用大型语言模型变革科学:关于人工智能辅助科学发现、实验、内容生成与评估的调研》

  85. 《世界银行:2025 极端天气高昂代价:气候变化背景下的马拉维金融韧性构建研究报告(76 页)》

  86. 《北京理工大学:2025 年中国能源经济指数研究及展望报告》

  87. 《Space Capital:2024 年第四季度太空投资报告(22 页)》

  88. 《NetDocuments:2025 年法律科技趋势报告(32 页)》

  89. 《CB Insights:2024 年度全球企业风险投资(CVC)状况报告:私募市场交易、投融资数据及分析(130 页)》

  90. 《Artlist:2025 年全球内容与创意趋势报告(59 页)》

  91. 《IBM 商业价值研究院:2024 投资人工智能伦理和治理必要性研究报告:AI 伦理前线五位高管的真实故事(24 页)》

  92. 《世界基准联盟(WBA):2025 塑造未来:对可持续发展目标(SDGs)影响最大的 2000 家公司研究报告(46 页)》

  93. 《清华大学:2025 年 DeepSeek 从入门到精通(104 页)》

  94. 《麦肯锡:2025 工作场所中的超级代理 (Superagency):赋能人类解锁人工智能的全部潜力(47 页)》

  95. 《凯捷(Capgemini):科技愿景 2025:关键新兴科技趋势探索(54 页)》

  96. 《硅谷银行(SVB):2025 年上半年全球创新经济展望报告(39 页)》

  97. 《BCG:2025 工业运营前沿技术:AI 智能体 (AI Agents) 的崛起白皮书(26 页)》

  98. 《DrakeStar:2024 年全球游戏与电竞行业报告(26 页)》

  99. 《理特咨询(ADL):2025 人工智能驱动的研究、开发与创新突破的新时代研究报告(80 页)》

  100. 《互联网安全中心(CIS):2024 年网络安全冬季报告:回顾与展望(30 页)》

  101. 《方舟投资(ARK Invest):Big Ideas 2025 - 年度投研报告(148 页)》

  102. 《DeepSeek:2024 年 DeepSeek-V2 模型技术报告:经济、高效的混合专家语言模型(52 页)》

  103. 《CB Insights:2024 年度全球风险投资状况回顾报告:私募市场交易、投融资和退出数据及分析(273 页)》

  104. 《全国智标委:2025 城市生命线数字化标准体系研究报告(105 页)》

  105. 《经合组织(OECD):2024 年全球政府创新趋势报告:促进以人为本的公共服务(46 页)》

  106. 《DeepSeek_R1 技术报告》

  107. 《摩根斯坦利报告 —DeepSeek 对于科技和更广义经济的含义是什么?》

  108. 《李飞飞最新 S1 模型的论文:s1 Simple test-time scaling》

  109. 《世界经济论坛 -《全球经济未来:2030 年的生产力》报告》

  110. 《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》

  111. 《百页大语言模型新书》(209 页 pdf)

  112. 《量子技术和网络安全:技术、治理和政策挑战》(107 页)

  113. 《大语言模型中的对齐伪造》(137 页)

  114. 《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》(美陆军 232 页)

  115. 《美国防部 CDAO:人工智能模型的测试与评估》(66 页 slides)

  116. 《自动驾驶的世界模型综述》

  117. 《Questel2024 深度学习领域专利全景报告》(英文版 34 页)

  118. 《深度解析 Palantir》(20250122_204934.pdf)

上下滑动查看更多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值