通过materials project 中的pymatgen计算形成能formation energy和e above hull

if you ->会anaconda & 会 Python:then 拷贝代码,安装代码中的import包,运行代码->完事儿

前言

材料数据库Materials Project应该是大家用得最多的数据库,其中包含数十万的DFT计算数据。而其团队为数据库配套开发的python包Pymatgen也是功能丰富,本文将详细介绍如何利用pymatgen计算指定组分的energy above hull 以及形成能formation energy。
其实pymatgen的官网有给出利用materials project中的数据计算energy above hull的实例,但是有这么一种情况,我们做完DFT计算后,拥有若干化学式-静态总能(ev)这样的数据,要如何计算这些数据的e above hull 和形成能呢?毕竟官网给的实例,以及youtube上的实例是直接计算MP数据库中某种组分的相图和e above hull。其实通过看pymatgen的文档和e above hull 计算的源码可以发现,用自己计算的DFT数据也是可以计算其对应的e above hull 的。
其原理很简单,就是用总能-各元素基态能的加和,计算得到形成能,然后结合MP上的子成分形成能画相图,然后就可以计算e above hull了。举个例子,我手上有这么一组数据,CsPbI3-静态总能Etot,要计算CsPbI3的e above hull. 先从MP上下载CsPbI3包含的所有数据,如Cs,Pb,I,CsI,PbI2等,包含化学式和各种性质,每组数据被称为一个entry,如图1。可以看到每个entry有总能,计算细节等信息,其实还有形成能这些信息,没显示出来。有了这些子成分的信息(形成能,总能)后,就可以计算CsPbI3的形成能了,在子成分Cs,Pb,I中找能量最低的那个来计算就行了。有了形成能,也就可以画相图,计算e above hull了。如图2,先新建一个包含Cs4Pb4I12信息的entry,然后把这个entry和之前的子成分entries合并在一起,就可以画相图了。那个no ID的就是我们自己导入的数据,形成能是-1.226eV/atom,e above hull是0.039eV/atom。
图1 MP上Download数据

图1 MP上Download数据

图2 CsPbI3相图计算
图2 CsPbI3相图计算

存在的问题

显然,这个CsPbI3的形成能和e above hull 是用自己计算的能量和MP数据库中子成分的能量计算出来的,如果两个能量的计算参数不同,或者DFT的泛函不同,那能量肯定就不在一个尺度上。这样计算出来的形成能和e above hull 就并不准确。有两种思路来解决这个问题,第一,自己DFT计算的时候严格保证和MP上的计算参数相同。第二,建立一个能量标准来划分稳定相和亚稳定相。比如我们计算的DFT数据中某个相是公认稳定的,我们就以这个相计算出来的e above hull 的值作为稳定相判据的上限。比如CsSnI3 是稳定的,它的e above hull是0.045eV/atom(瞎举的例子,我也不知道CsSnI3是否真的稳定!)。那么我们可以认为CsPbI3 也是稳定的,它的e above hull 小于0.045,就可以把0.045定为稳定相的上限值,同理,找个亚稳定相可以定一个亚稳相上限。第二种方法我也是偶然在某篇文献中看到的,不确定是否正确,文献也找不到了。

上代码

我把上述计算形成能和e above hull 的过程写成了函数,输入为excel表,输出为对应形成能和e above hull的excel表。大家可以利用这个函数进行批量计算。使用时代码需要修改两个地方,第一个为输入的excel路径,也就是第二个代码块中的tot_energy_excel_path=‘test.xlsx’,引号中为excel路径,像这样用相对路径时,需要把excel文件放到代码的同级目录,也可以用绝对路径。第二地方是MPAPI_KEY=‘xxxxx’,引号中的为MP提供的API KEY(2023年3月12日更正: 使用MP新版本中的API出现了返回的子成分能量与网站中的对应不上的问题,且有大量重复,导致ehull计算结果出现明显错误,建议使用老网站中的API_KEY,测试发现返回值正常,后续会向MP反映这个bug====2023年3月13日更正: MP开发人员反馈是mp-api版本原因,使用pip install mp-api --upgrade更新为最新版后问题解决,PS.只更新pymatgen不会同时更新mp-api),是下载数据用的,需要在MP官网中拷贝。如图3,点击官网首页右上方的API。然后选中图中红色的API KEY 替换为代码中引号内的内容就行。
运行第一个代码块:运行函数
第二个代码块:调用函数开始计算
第三个代码块:保存结果为aboveHull_result.xlsx’,在代码文件的同级目录
第四个代码块:画第index个样本的相图
注意:导入的excel表数据格式如图4,共两列,第一列为化学式,第二列为总能,化学式一定是一个元素跟一个数字,1可以省略,不要有括号那些,总能是这个化学式下的总能量,千万不要用每原子能量。输出的excel表如图5,输出的文件名可以在第三个代码块的引号中更改。

from pymatgen.analysis.phase_diagram import PDEntry, PhaseDiagram
from pymatgen.analysis.phase_diagram import PDPlotter
from pymatgen.ext.matproj import MPRester
import re
def get_above_hull_and_formation_enrgy_by_total_energy(tot_energy_excel_path,MPAPI_KEY):
    import pandas as pd
    # 导入化学式——总能量数据表
    tot_energy_excel = pd.read_excel(tot_energy_excel_path)
    formu_energy_dic = dict(zip(tot_energy_excel.iloc[:,0],tot_energy_excel.iloc[:,1]))
    #批量处理分支
    #获取MP数据
    pd_list = []
    forma_energy_list = []
    e_above_hull_list = []
    with MPRester(MPAPI_KEY) as mpr:
        for key in formu_energy_dic:
            div = re.compile(r"([A-Z][a-z])|([A-Z])|(\(.*\))")
            ele_list = div.findall(key)
            formu_key=''
            for el in ele_list:
                for e in el:
                    if e != '':
                        formu_key+=e+'-'
            formu_key=formu_key.strip('-')
            print(key)
            entries = mpr.get_entries_in_chemsys(formu_key)#获取MP数据库所有相关相
            pdentry = PDEntry(composition=key,energy=formu_energy_dic[key])#创建自己导入的化学式-总能相
            entries.append(pdentry)
            # 画相图
            pd = PhaseDiagram(entries=entries)
           
            #计算导入相形成能
            forma_energy_list.append(pd.get_form_energy_per_atom(pdentry))
            #计算导入相above hull
            e_above_hull_list.append(pd.get_e_above_hull(pdentry))

#             plotter = PDPlotter(pd)
#             plotter.get_plot()
            pd_list.append(pd)
    tot_energy_excel['formation_energy_per_atom']=forma_energy_list
    tot_energy_excel['e_above_hull'] = e_above_hull_list
    res_excel = tot_energy_excel
    display(res_excel)
    return pd_list,formu_energy_dic,res_excel
pd_list,formu_energy_dic,res_excel = get_above_hull_and_formation_enrgy_by_total_energy(tot_energy_excel_path='test.xlsx',MPAPI_KEY='xxxxx')
# 将结果保存为Excel
res_excel.to_excel('aboveHull_result.xlsx')
#画相图,只能手动更改index值指定画第几个化学式的相图
index = 0 #  第index个样本的相图
display(res_excel.iloc[index,:])
plotter = PDPlotter(pd_list[index])
plotter.get_plot()

图3 MP上获取API KEY

图3 MP上获取API KEY,红色那串就是

图4 导入的excel表数据格式
图4 导入的excel表数据格式
图5 输出结果
图5 输出结果

ok 以上就是全部内容,有问题可以留言。

  • 9
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 28
    评论
1.1量子力学方法 1.1.1 CASTEP CASTEP由Cambridge大学Mike Payne教授发布,采用密度泛函理论、平面波赝势法(用平面波描述外层价电子,内层电子用赝势代替),进行第一性原理量子力学计算的程序。其总能量包含动能、静电能和交换关联能三部分,各部分能量都可以表示成密度的函数。电子与电子相互作用的交换和相关效应采用局域密度近似(LDA)或广义密度近似(GGA),静电势只考虑作用在系统价电子的有效势(即赝势:Ultrasoft 或norm-conserving),电子波函数用平面波基组扩展(基组数由Ecut-off确定),电子状态方程采用数值求解(积分点数由FFT mesh确定),电子气的密度由分子轨道波函数构造,分子轨道波函数采用原子轨道的线性组合(LCAO)构成。计算总能量采用SCF迭代。CASTEP在计算分子、固体、表面、界面、掺杂、错位等方面非常有优势。 主要功能及特性:  支持 PBE、PBE0、HSE03、HSE06以及SCAN meta-GGA 等交换关联泛函;  能量计算形成能、吸附能、缺陷形成能、内聚能、表面能等;  结构优化:力与应力的计算、几何驰豫(原子坐标、晶胞参数、键长、键角、)等;  过渡态:过渡态搜索等;  电子结构:能带、态密度(局域、分波)、声子谱、电荷密度、差分电荷密度、电子局域函数、电子轨道、扫描隧道显微镜STM模拟、共价键级、静电势(支持可视化)、静电荷(Mulliken、Hirshfeld)、功函数、自旋极化(共线、非共线)、支持旋轨耦合、费米面、支持利用On-the-fly 生成模守恒(normconserving)赝势,特别适用于计算磁性材料和包含f电子的元素;  介电性质:波恩有效电荷、静态介电常数张量、极化率张量;  力学性质:弹性力常数张量,体模量,剪切模量,杨氏模量,泊松比;热力学性质:声子态密度、色散谱、熵、焓、自由能、零点能、德拜温度、等容热容随温度的变化曲线;  光学性质:红外光谱、拉曼光谱5.0、核磁共振谱(NMR CASTEP,可用DFT+U)、电子能量损失谱4.4(旋轨耦合效应5.5)、X射线吸收谱4.4(旋轨耦合效应5.5)、光频介电常数虚(实)部、吸收系数、折射率、能量损失函数、光导率虚(实)部;  动力学计算:支持NVE、NVT、NPT以及NPH等系综,以及多种控温控压函数;

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 28
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值