【材料化学工具汇总】开源科学大模型;材料分析Python库;分子并行模拟器;自动材料探测...

在 AI for Science 的规模化推广过程中,低门槛使用且开源的高性能工具至关重要。一方面,科研人员能够通过上手使用,更加直观地了解 AI 的能力;另一方面,当团队中缺乏交叉学科人才时,已有工具能够减少科研人员探索 AI 应用的成本,加速研究进程。

为了方便大家检索易用的开源工具,HyperAI超神经将面向不同的学科领域,定期汇总整理优质工具资源。如果大家发现好用的工具,也欢迎以后台留言的形式分享给我们!

本期介绍的是材料化学领域的工具资源:

*Pymatgen:材料分析 Python 库

*PubChemPy:化学工具包

*Bert-loves-chemistry:化学建模

*LAMMPS:大规模原子分子并行模拟器

*NIMS-OS:自动材料探测

*ChemCrow:简化常见化学任务推理

*浦科化学:开源科学大模型

*Open Catalyst Project:挖掘用于可再生能源储存的新催化剂

*Materials Projects:计算材料性质

Pymatgen:材料分析 Python 库

Pymatgen (Python Materials Genomics) 是一个开源的、可用于材料分析的 Python 库,拥有强大的材料分析代码,为结构和分子定义了类别,并支持多种电子结构代码,为材料项目提供动力。

资源地址:

https://github.com/materialsproject/pymatgen

PubChemPy:化学工具包

PubChemPy 依赖于 PubChem 数据库,是一个通过 PUG REST Web 服务的化学工具包,提供了一种在 Python 中与 PubChem 交互的方法,允许用户通过名称、子结构和相似性进行文件格式转换和化学性质检索等功能。

资源地址:

https://github.com/mcs07/PubChemPy

Bert-loves-chemistry:化学建模

Bert-loves-chemistry 是应用于化学 SMILES 数据的 HuggingFace 模型存储库,可用于药物设计、化学建模和特性预测等。

资源地址:

https://github.com/seyonechithrananda/bert-loves-chemistry

LAMMPS:大规模原子分子并行模拟器

Large-scale Atomic/Molecular Massively Parallel Simulator,分子动力学模拟,专注于材料建模。在固态材料(金属、半导体)和软物质(生物分子、聚合物)以及粗粒等方面具有潜力,可用于原子、介观或连续尺度的并行粒子模拟。

资源地址:

https://github.com/lammps/lammps

NIMS-OS:自动材料探测

NIMS-OS (NIMS Orchestration System) 是一个 Python 库,无需人工干预,即可进行自动材料探测。NIMS 自动机器人电化学实验 (NAREE) 系统可用作机器人实验,还能够提供结果可视化工具,允许用户实时检查优化结果。

资源地址:

https://github.com/nimsos-dev/nimsos

ChemCrow:简化常见化学任务推理

ChemCrow 是一个开源软件包,整合了 13 种专家设计的化学工具,旨在简化药物、材料设计和合成等领域中各种常见化学任务的推理过程。模型在合成生成的流程图的独立测试数据集上实现了 80% 的 top-1 准确度和 84% 的 top-5 准确度,可以学习自动更正合成流程图。

资源地址:

https://github.com/ur-whitelab/chemcrow-public

浦科化学:开源科学大模型

上海人工智能实验室开源发布的首个科学大模型浦科化学 (ChemLLM),通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。同时,研究人员发现,随着化学能力的获得,大模型的数理学科及推理能力也得到增强。

资源地址:

https://huggingface.co/AI4Chem/ChemLLM-7B-Chat

Open Catalyst Project:挖掘催化剂

Open Catalyst Project 是 Meta AI 的基础人工智能研究部门 (FAIR) 和卡内基梅隆大学化学工程系 (CMU) 合作的研究成果,旨在利用 AI 建模并挖掘可用于可再生能源储存的新催化剂,以应对气候变化。

为了使更多研究人员加入 Open Catalyst Project,该团队发布了 Open Catalyst 2020 (OC20) 和 Open Catalyst 2022 (OC22) 数据集,用于训练机器学习模型。数据集共包含 130 万个分子弛豫 (molecular relaxation),以及超过 2.6 亿次 DFT 计算的计算结果。此外,基础模型和代码也一并在 Github 上开源。

资源地址:

https://github.com/Open-Catalyst-Project

Materials Projects:计算材料性质

Materials Projects 旨在计算所有无机材料的性质,并免费为每位材料研究人员提供数据和相关的分析算法。该项目的最终目标是,通过把重点放在那些在计算上最有前途的化合物上,从而大大减少研发新材料所需的时间。目前,其可以为研究人员提供:

* Pymatgen:用于材料分析的开源 Python 库,研究人员能够访问 Materials API 进一步分析复杂的材料数据集。

* Crystal Toolkit:开源 Web 应用程序框,用于显示常见的材料数据类型,如晶体结构、能带结构等,专门为 Python 用户设计,允许用户开发完整的网络应用程序,而无需学习传统的网络技术。

* FireWorks:免费开源代码,可以用于自动计算任意计算资源,支持在大型计算中心运行高吞吐量计算。

* Atomate:为执行复杂的材料计算提供了「配方」,只需几行代码就能自动执行一系列相互关联的复杂计算。

资源地址:

https://next-gen.materialsproject.org/

 往期推荐 

e17ed8165578a9fd76f1c61b05a91ed7.png

18c40e5cbf882b0da3958da958f4c044.png

3dbba9241bfa27a3b0d28481699250bb.png

b6496495a0231a26948628ff24ef6961.gif

78f470b8a6b2410ded5411e99d83481c.gif

戳“阅读原文”,免费获取海量数据集资源!

  • 11
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值