使用线性标度三维分块算法进行平面波精度10万原子体系计算

线性标度三维分块算法

超大体系计算模拟用途广泛,可以用于晶界、位错、缺陷、非晶态或者实际器件研究。然而,对于大于10,000个原子的系统,例如实际的量子结构、量子器件等,通常只能由世界上最大的超级计算机来进行第一性原理的计算。2011年,TOP500中排名第一的超级计算机“京”因计算出10万个原子系统而获得了当年的戈登.贝尔奖。这一计算使用了较低的截断能(在倒空间中等于10 Ryd),计算一次SCF迭代大约需要1.5个小时,完成整个系统迭代过程则需要数天时间。对于平面波精度计算而言,如此大规模计算是巨大挑战,因为每个原子都有数百个基组函数。“京”超算的建设成本高达60亿人民币,超大体系昂贵的计算成本对于绝大多数研究课题组都是无法承受的。

中国科学院半导体研究所在北京龙讯旷腾科技有限公司负责建设的200个GPU的超算平台(Mstation Cluster,以下简称Mcluster)上实现了平面波精度的10万原子体系计算,总的计算时间只需要23小时。中国科学院半导体研究所叶萌博士与北京龙讯旷腾科技有限公司合作,在上述Mcluster上实现和优化了该公司特有的线性标度三维分块算法,使得平面波精度10万原子超大规模的模拟得以在造价远远低于大型超算的平台上实现。值得注意的是,上述工作中的线性标度三维分块算法使用的实空间网格是2011年获得戈登·贝尔奖方法的6倍,整体而言速度比“京”超算方案快10-30倍。由此见可,线性标度三维分块算法+Mcluster的模式能给科研用户和工业界带来全新的研究方法和领域,让科研用户在竞争中胜人一筹,让工业界用户可以真正解决遇到的实际问题。

线性标度三维分块算法基于分而治之的思想,将大体系划分为许多小片段,每个小片段单独用DFT方法进行计算,然后将计算完的小片段组合拼接起来,从而得到大体系的电子结构性质。线性标度三维分块算法得以实施的基础是总能可以分为两部分:静电能和量子机械能(例如,动能和交换关联能)。其中静电能是远程的作用,所以必须对整体求解一个泊松方程,而计算昂贵的量子机械能是短程的作用,所以将整个系统切分成小片段,分别单独计算这些小片段的量子机械能,然后结合每个小片段DFT计算的能量,从而获得整个系统的能量。这其中需要解决的关键问题是如何组合拼接小片段,北京龙讯旷腾科技有限公司提出了一种新颖的拼接方案,可以通过特殊求和消除边界影响。在该计算方法中,一旦小片段尺寸被确定,以获得给定的数值精度,计算量与小片段数量成正比,因此,我们称其为线性标度三维分块方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值