Regression
matbench_v0.1 matbench_dielectric
- 用于从**结构(structure)**预测折射率。
- 改编自 Materials Project 数据库。删除了形成能量(或凸包上方的能量)超过 150meV 的条目和折射率小于 1 的条目以及包含惰性气体的条目。
- 样本数目: 4764
- 数据列:
- n:折射率(无单位).
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_expt_gap
- 用于仅从**成分(composition)**预测实验带隙。
- 取自Zhuo等人的论文数据集,根据成分进行重复数据删除,去除带隙超过 0.1eV 范围的成分;
- 样本数目: 4604
- 最好 mean mae 0.3310
- 数据列:
- composition:化学式。
- gap expt:实验测量的间隙,以 eV 为单位
matbench_v0.1 matbench_jdft2d
- 从晶体结构预测剥离能量(使用 OptB88vdW 和 TBmBJ 泛函计算)
- 改编自 JARVIS DFT 数据库,已去重使得该数据集现没有成分既是金属又是非金属。根据成分进行重复数据删除,确保没有成分报告为 GFA 和非 GFA
- 数据点 : 636
- 最好mean mae:33.1918(MODNet (v0.1.12))
- 数据列:
- exfoliation_en:剥离能量(Exfoliation energy)(meV/atom)。
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_log_gvrh
- 从结构预测 DFT log10 VRH 平均剪切模量
- 改编自 Materials Project 数据库,删除了形成能量(或凸包上方的能量)超过 150meV 的条目和负数( G_Voigt, G_Reuss, G_VRH, K_Voigt, K_Reuss, 或者 K_VRH)的条目,不在G_Reuss <= G_VRH <= G_Voigt or K_Reuss <= K_VRH <= K_Voigt范围内的以及含有惰性气体的
- 数据点 : 10987
- 最好mean mae:0.0715(ALIGNN)
- 数据列:
- log10(G_VRH):目标变量。 DFT Voigt-Reuss-Hill 平均剪切模量以 GPa 为单位的以 10 为底的对数
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_log_kvrh
- 从结构预测 DFT log10 VRH 平均体积模量
- 改编自 Materials Project 数据库,删除了形成能量(或凸包上方的能量)超过 150meV 的条目和负数( G_Voigt, G_Reuss, G_VRH, K_Voigt, K_Reuss, 或者 K_VRH)的条目,不在G_Reuss <= G_VRH <= G_Voigt or K_Reuss <= K_VRH <= K_Voigt范围内的以及含有惰性气体的
- 数据点 : 10987
- 最好mean mae:0.0548(MODNet (v0.1.12))
- 数据列:
- log10(K_VRH):目标变量。 DFT Voigt-Reuss-Hill 平均体积模量以 GPa 为单位的以 10 为底的对数。
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_mp_e_form
- 从结构预测 DFT 形成能。
- 改编自 Materials Project 数据库,删除了形成能超过 2.5eV 和含有惰性气体的条目
- 数据点 : 132752
- 最好mean mae:0.0215(ALIGNN)
- 数据列:
- e_form:由 Materials Project 计算的以 eV 为单位的形成能
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_mp_gap
- 从结构预测 DFT PBE 带隙。
- 改编自 Materials Project 数据库,删除了形成能量(或凸包以上的能量)超过 150meV 和含有惰性气体的条目。
- 数据点: 106113
- 最好mean mae:0.1861(ALIGNN)
- 数据列:
- gap pbe:Materials Project 中 PBE DFT 计算的带隙,以 eV 为单位。
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_perovskites
- 从晶体结构预测形成能
- 改编自 Castelli 等人生成的原始数据集。
- 数据点: 18928
- 最好mean mae:0.0288(ALIGNN)
- 数据列:
- e_form:整个 5 原子钙钛矿电池的生成热,以 eV 为单位,由 RPBE GGA-DFT 计算。请注意,氧气的参考状态是根据氧气在水蒸气中的化学势而不是氧气分子计算的,以反映这些钙钛矿的研究应用。
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_phonons
- 从晶体结构预测振动特性(vibration properties )
- 从 Petretto 等人那里检索到的原始数据。原始计算通过 ABINIT 在基于密度泛函微扰理论的谐波近似中完成。移除了形成能量(或凸包上方的能量)超过 150meV 的条目。
- 数据点: 1265
- 最好mean mae:28.7606(MegNet (kgcnn v2.1.0))
- 数据列:
- last phdos peak(最后一个 phdos 峰值):最高频率光学声子模式峰的频率,单位为1/cm;可用作主要纵向光学声子频率的估计。
- structure: Pymatgen Structure of the material.
matbench_v0.1 matbench_steels
- 用于仅从化学成分预测钢的屈服强度
- 来自Citrine informatics。已去重
- 数据点: 312
- 最好mean mae:87.7627(MODNet (v0.1.12) )
- 数据列:
- 组成composition:化学式
- yield strength屈服强度:实验测量的钢材屈服强度,以 MPa 为单位。
Classification
matbench_expt_is_metal
- 仅从成分对是否金属分类。
- 取自Zhuo等人的论文数据集,已去重使得该数据集现没有成分既是金属又是非金属。
- 数据点 4921。
- 最好ROCAUC:0.9209
- 数据列:
- composition:化学式。
- is_metal:如果是金属则为 1,如果是非金属则为 0。
matbench_v0.1 matbench_glass
- 用于根据化学式预测全块金属玻璃形成能力
- 摘自《三元非晶合金的非平衡相图》,已去重使得该数据集现没有成分既是金属又是非金属。根据成分已进行重复数据删除,确保没有成分报告为 GFA 和非 GFA
- 数据点 5680。
- 最好ROCAUC:0.9603
- 数据列:
- composition:化学式。
- gfa:玻璃形成能力(Glass forming ability):1表示玻璃形成,对应非晶态,0表示非全玻璃形成
matbench_v0.1 matbench_mp_is_metal
- 从结构预测 DFT 金属
- 取自 Materials Project 数据库。删除了形成能量(或凸包以上的能量)超过 150meV 和含有惰性气体的条目。
- 数据点106113。
- 最好ROCAUC:0.9520(CGCNN v2019)
- 数据列:
- is_metal:如果化合物是金属则为 1,如果化合物不是金属则为 0。
- structure: Pymatgen Structure of the material.