33 分钟生成 12 万种碳捕捉候选材料,美国阿贡国家实验室发布生成式 AI 框架,加速 MOFs 创新

在工业化飞速发展的大环境下,地球正面临着一个严峻而急迫的问题一一过度的二氧化碳排放。二氧化碳就像是一层无形的厚茧裹住了人类赖以生存的家园,悄然改变着全球的气候,也带来了诸如极端天气频发、生态系统重创、农业生产受阻和公共卫生挑战等一系列连锁反应。

作为一种解决二氧化碳高排放的前沿手段,碳捕捉技术的创新与发展显得尤为重要,得到了更加广泛的关注。该技术是利用物理或化学方法,从大型排放源中提取二氧化碳,并对其进行处理,避免二氧化碳直接进入大气中,从而达到减排的目的。

近年来,一种名为金属有机框架 (Metal-Organic Frameworks,简称 MOFs) 的新型多孔晶体材料,因其独特的结构和性能引起了众多研究者的广泛关注。MOFs 由金属离子与有机配体通过配位键自组装而成,相较于传统的活性炭、分子筛等固体吸附剂,它们更环保、能耗更低,在二氧化碳吸附方面展现出更好的性能。

然而,目前 MOFs 的生产设计通常依赖于大量的实验数据和计算工作,既昂贵又耗时。为此,来自美国阿贡国家实验室的研究团队,提出了一种生成式 AI 框架 GHP-MOFsassemble, 该框架能够随机生成并组装新的 MOFs 结构,通过分子动力学模拟筛选高稳定性的 MOFs 结构,并用晶体图神经网络 (Crystal Graph Convolutional Neural Network, CGCNN) 和 Grand Canonical Monte Carlo simulations 来测试 MOFs 对二氧化碳的吸附能力。结果显示,该方法在 33 分钟内就快速组装出 12 万个新的候选 MOFs,极大促进了 MOFs 设计的未来发展。

研究亮点:

  • 生成式 AI 框架 GHP-MOFsassemble 在 33 分钟内快速组装出 12 万个新的候选 MOFs

  • 该方法能够降低构建大型数据库的高昂成本

图片

论文地址:
https://www.nature.com/articles/s42004-023-01090-2

一键下载数据集:

https://bit.ly/3IlrvQl
关注公众号,后台回复「MOFs」获取完整 PDF

三大结构组成高通量计算框架

研究人员提出的 GHP-MOFsassemble 方法是一种新型的高通量计算框架,该框架主要包括三个组成部分:分解 (Decompose)、生成 (Generate) 、筛选与预测 (Screen and Predict)。

Decompose:用 MMPA 分解 hMOFs 数据集

研究选择的 hMOFs 是一个高性能金属有机骨架材料 (High-performance Metal-Organic Frameworks) 的相关数据集,其中包含了经过筛选或实验验证的高性能 MOFs 结构信息。

图片

Zn tetramer-pcu MOFs的分解步骤

碳为灰色,氧为红色,氮为蓝色,氢为白色

在 hMOFs 数据集中,频繁出现三种类型的拓扑结构——Cu PW-pcu, Zn PW-pcu 和 Zn TM-pcu,这三种类型的结构占数据集总数的 74%,共 102,117 个 hMOF 结构。研究人员选取了其中具有正确解析的 MOFids 和有效的 SMILES 结构,共 78,238 个 MOF 结构数据。
SMILES:Simplified molecular input line entry system,简化分子线性输入规范

图片

hMOFs 数据集属性

研究人员选取了从高性能 hMOF 结构中提取了 540 个分子片段(上表最后一列),通过匹配分子对算法 (MMPA) 对 540 个独特结构进行分解,并提取其分子片段。使用 DiffLinker 生成新的 MOFs 连接物。

Generate:扩散模型生成新 MOFs 连接物

图片

Zn tetramer-pcu MOFs结构的生成步骤碳为灰色、氧为红色、氮为蓝色、氢为白色

对于 GHP-MOFassemble 框架中的生成部分,首先,研究人员提取上述 540 个独特结构的分子片段,利用扩散模型 DiffLinker 生成新的 MOFs 连接物。

在这一过程中,研究人员利用 openbabel 添加氢原子,并删除具有错误氢分配的连接物,执行虚拟原子识别过程,生成能够与金属节点组装的信息,随后再经过元件过滤器处理,最终得到了 12,305 个连接物。最后,随机选取三个由 DiffLinker 生成的连接物和一个在 hMOFs 数据集中频繁出现的金属节点进行组装。

据悉,研究人员在阿贡国家实验室 (ALCF) 的 Theta 超级计算机上,在 33 分钟内便生成了 12 万 个具有 pcu 拓扑结构的新 MOFs。

Screen and Predict:CGCNN 模型测试二氧化碳吸附能力

研究人员对得到的新 MOFs 结构进行了几何结构检查,在 40 分钟内确定了 78,796 个具有有效键长的 MOF。随后还进行了预模拟检查,在不到 4 小时内(205 分钟)确定了有 18,770 个 MOFs 成功生成了 LAMMPS输入文件。为了减少 LAMMPS 的模拟次数,研究人员训练了一个 CGCNN 模型对 MOFs 的吸附性能进行了筛选。
LAMMPS:Large-scale Atomic/Molecular Massively Parallel Simulator,大规模原子分子并行模拟器

CGCNN 模型训练过程:使用 hMOF 数据集中的 MOFs 结构及其在 0.1 bar 时二氧化碳吸附量作为输入数据。将 hMOF 数据集分成三个独立的数据集:80% 用于训练,10% 用于验证,10% 用于测试。通过这种数据分割,使用随机权重初始化的方法训练了 3 个 CGCNN 模型。

通过在 NVIDIA A40 GPU 上基于 CGCNN 模型进行训练,研究人员对上述 18,770 个通过筛选的 MOFs 结构进行二氧化碳吸附能力的预测,将其中得到的 364 个吸附性能高的 MOFs 结构进行分子动力学模拟,整个 AI 推理过程在 50 分钟内完成。

总结来看,研究人员基于 GHP-MOFsassemble 框架,在 5 小时 7 分钟内完成了 MOFs 新结构的生成与高性能结构的筛选等全流程。

图片

基于GCMC模拟和CGCNN模型

6种MOFs分别在0.1bar和300K下的二氧化碳吸附量

最终,研究人员确定了 102 个稳定且高性能的 MOFs 结构,并对这 102 个 MOFs 进行 Grand Canonical Monte Carlo (GCMC) 模拟, 计算它们在 0.1 bar 和 300K 条件下的二氧化碳吸附能力,发现了 6 个二氧化碳吸附能力高于 2 m mol g−1 的 MOFs,这 6 种 MOFs 的晶体结构如下:

图片

6种MOFs的晶体结构

碳为灰色,氮为深蓝色,氟为青色,锌为紫色,氢为白色,锂为绿色

实验结论:AI 框架可以生成有效的新型 MOFs

图片

AI生成的配体与hMOFs配体之间相似性的分布情况

研究人员将基于 AI 框架生成的配体与 hMOFs 配体进行相似度分析,发现 AI 生成的配体与 hMOFs 中的配体相似度仅为 30%-40%,这说明 AI 框架能够生成新的配体。

0.4 处相似度的高峰值又表明 AI 能够生成类似 hMOFs 中已有的配体,即可说明此 AI 框架下生成的 MOFs 具有实际有效性。

值得一提的是,尽管 GHP-MOFassemble 能够成功发现和验证具有优异性能的金属有机框架结构,但它并不完美。实验过程的筛选规则、模拟条件和模型的精确度都将影响结果的准确性,由该 AI 框架筛选出来的 MOFs 的性能也还需要在实验中进一步验证。

AI 深入碳捕捉,英伟达模拟速度飙升 70 万倍

现今,应对气候变化已经上升为一项全球性挑战,关系到全人类的共同未来。我国政府对此给予高度重视,并设定了清晰的减排路径:计划于 2030 年前二氧化碳排放达到峰值,争取 2060 年前实现碳中和。当「碳达峰」与「碳中和」的愿景与 AI 数字化科技相碰撞,将会催生一系列的未来变革。实际上,人工智能一直在为低碳寻找解决方案。

图片

人工智能助力城市「双碳」目标的总体框架图

来源:百度智能云

微软曾表示,AI 技术能够利用大量来源不同渠道的数据进行复杂问题的解决,从而助力全球生产力的提升,并在降低二氧化碳及其它温室气体排放方面发挥作用。 另外,萨里大学教授 Jin Xuan 也曾在其研究中表明,借助 AI 模型,可能将燃煤发电厂碳捕捉设施的能源消耗减少 1/3 以上,提高二氧化碳捕捉效率至少 16.7%。

此外,英伟达也发布了全栈式开放平台 Earth-2,可通过交互式高分辨率模拟加速气候和天气预报。同时,英伟达使用里叶神经算子和神经网络框架 NVIDIA Modulus,将碳捕捉和存储的模拟分析速度提高 70 万倍,2.8 秒即可完成对二氧化碳羽流和压力累积的可靠性评估,这一提升无疑为后续的碳捕捉研究提供了技术支持。

面对日益严重的环境压力和生态警示,推动碳捕捉技术的突破与应用,已不再仅仅是一个科学命题,更是关乎人类可持续发展的时代课题。将 AI 技术融入碳捕捉过程,特别是在设计金属有机框架 (MOFs) 等新型材料领域,将有望带来新一轮的科技突破,助推全球经济社会体系朝着更加绿色、低碳的方向转型。

参考资料:
1.https:www.ambchina.com
2.https:www.nvidia.cn/high-performance-computing/earth-2/
3.http://www.tanpaifang.com/CCUS/202307/1198593.html
4.http://m.xinhuanet.com/tech/2021-04/01/c_1127280796.htm

  • 22
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
2024年超级计算机TOP500强前十排名具体如下: 1. **Frontier**:美国橡树岭国家实验室的Frontier继续位居榜首,是世界上速度最快的超级计算机。 2. **Fugaku**:日本理化学研究所的Fugaku,位于日本富岳,曾是世界上最快的超级计算机。 3. **Shanghai Supercomputer Center**:上海超级计算中心的系统,中国在高性能计算领域的发展迅速。 4. **Sequoia**:美国阿贡国家实验室的Sequoia,也是一台性能极高的超级计算机。 5. **Titan**:美国能源部奥克里奇国家实验室的Titan,长期以来一直是TOP500排行榜上的常客。 6. **Stampede**:同样来自橡树岭国家实验室的Stampede,在多个版本的排行榜上都有出色表现。 7. **Cori**:位于劳伦斯伯克利国家实验室的Cori,是专为开放科学而设计的超级计算机。 8. **Trinity**:美国能源部洛斯阿拉莫斯国家实验室的Trinity,具有强大的计算能力。 9. **Pioneer**:位于美国阿尔贡国家实验室的Pioneer,是一台先进的超级计算机。 10. **Astra**:德国尤利希超级计算中心(JSC)的Astra,欧洲的高性能计算设施之一。 以上排名反映了全球在高性能计算领域的竞争态势,其中美国和中国在这一领域尤为突出。超级计算机的排名通常根据其处理速度(以每秒浮点运算次数,即FLOPS来衡量)来确定,这些计算机被广泛用于科学研究、气象预测、材料科学、生物信息学等多个领域。随着技术的不断进步,未来几年超级计算机的性能和排名可能会有显著变化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值