神威 计算机 应用,Gromacs在神威蓝光超级计算机上的部署和应用(2)

任何软件或硬件故障(包括网络通信故障,CPU异常等)都可能导致计算中断. 尽管应用程序已在其代码层中添加了一些故障监视和自动恢复功能,但超级计算系统还具有异常监视和检查点等机制来保留计算状态以进行恢复,但是在实际计算过程中,为了计算效率,系统检查点该策略通常是关闭的. 应用程序可以处理的错误也非常有限,因此通常需要手动检查作业的操作. 作业异常退出后,需要再次提交作业. 幸运的是,当程序异常退出时,Gromacs可以利用软件自身的中间结果继续进行计算. Gromacs行业的完成有两个迹象. 一是.log日志文件的最后一行,它输出: “ Finished mdrun ...”,另一则是生成.gro文件. 我们可以使用这两个特征来检测计算是否完成. 如果计算未完成,则需要跟踪已提交的作业. 根据作业管理系统,查询提交的作业是否仍在运行(作业编号,用户,资源和队列一一对应). 特别是,有时会检测到该作业,但是.log日志文件中有一个假死,但没有更改. 当检测到异常操作时,使用重新提交作业的命令重新提交作业. 继续计算命令如下: mdrun protein.tpr-cpi state.cpt -cpt选项在中断之前仍使用tpr文件,无需生成tpr文件.

865d1db331a4bb9ffe03c30191af6cc1.png

The

-cpi选项使用最新的cpt文件. 如果最新的cpt文件不正确,则可以使用较旧的cpt文件. 可以将上述检测和提交命令写入脚本,以实现自动作业检测和提交. 在实际的计算过程中,该自动脚本可以满足计算要求. 潘龙强等人总结并发布了测试的内容和结果,请参考相关内容以供参考. 测试内容和结果总结如下. 分子动力学模拟已被广泛用于研究蛋白质,核酸,糖和脂质等生物大分子的分子动力学. 传统的分子动力学模拟方法具有较少的计算核,可以有效地用于并行计算,并且模拟可以实现的时间尺度很短,这常常导致无法有效采样生物大分子的动态行为. 副本交换分子动力学(REMD)仿真方法可以同时运行多个独立的仿真,这需要数千个核心甚至数万个核心计算资源的支持,并且可以显着提真时间. 潘龙强等. 在国家济南超级计算中心的大型集群的基础上,使用了由纤维素酶催化的域CBHI-CD的模拟系统来测试单拷贝和多拷贝拷贝交换分子动力学仿真的应用. 测试结果表明,当Gromacs运行包含50,000个原始CBHI-CD系统,10,000个原子的分子动力学模拟的单个副本时. 图模拟系统催化域50000原子79 Gromacs在神威蓝光超级计算机上的部署和应用是常规的分子动力学模拟,实际最大计算速度为91.6 ns / d神威蓝光超级计算机 济南,最大加速比为72.7.

在多副本计算仿真测试中,最大累计总运行速度高达2274 ns / d,可以使用多达6720个CPU内核,并且仍然具有良好的并行性能,并且可以进一步增加计算节点的数量. . 可以看出,副本交换分子动力学模拟技术可以使成千上万的原子系统一天达到微秒级的时间尺度. 集群扩展到成千上万个核,并完成了对更多原子序数系统的更多模拟. 此外,我们还在家用SW1600平台上使用Gromacs测试了包含206,590个原子的蛋白质系统. 该测试使用PME(Particle-Mesh-Ewald)方法计算原子之间的静电相互作用. 截止距离为1.2nm. 学习每步计算2fs. Gromacs仿真系统的计算速度和计算加速度如下所示. 当蛋白质系统使用少量CPU内核运行Gromacs时,计算速度和加速比表明CPU(进程)数量呈线性增加;当CPU达到720以上时,计算速度和加速比开始急剧下降,这远远低于进程数少时的计算速度和加速比. 实际最快的计算速度为3.33 ns / d,最大加速比为541.5. 在200,000原子级的系统中,当CPU内核数达到720时,计算速度和加速比达到最大值. 由此可见,国产平台Gromacs具有良好的并行扩展能力.

同时,它也为选择计算条件(例如类似规模系统的CPU内核数)提供了重要参考. 结论本文描述了在济南国家超级计算中心的两组超级计算系统上部署Gromacs的过程,并使用了副本交换技术对100T集群进行了测试,并在国内平台上进行了测试. 它突破了单个分子动力学任务只能使用数百至数千个CPU内核的局限性,并为分子动力学仿真提供了使用数万个内核进行计算的新思路. 同时,在测试过程中,为了解决大型系统的鲁棒性问题,研究了自动检测和提交工作的方法,以便可以连续计算工作直到计算完成无需人工干预. 接下来,将对国产超十亿次超级计算机进行相应的测试,并根据国产计算机的特性进行优化. 致谢耿存良,潘龙强,王鲁山等人,山东大学微生物技术国家重点实验室. 感谢国家自然科学基金会(31070063)的资助. 参考%E8%AE%A1%E7%AE%97%E7%94%9F%E7%89%A9%E5%AD%A6. 范德·斯波尔(Vander Spoel)等人. GROMACS高效,负载均衡的测试系统使用Gromacs仿真. 图. 计算速度speedupratio的依赖性基于CPUcores的Gromacssimulation 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 100 100 200 200 300 300 400计算速度计算的加速比400 500 500 600 600 700 700 800 800 CPU 600 500 400 300 200 100 -10080信息技术与科研应用,2013,可扩展分子模拟[J]. Chem.Theory Comput. ,2008,CheathamIII等. 琥珀生物分子模拟程序[J]. Journal ComputationalChemistry,2005,26(16): 1668 – 1688. 总计CHARMM: 大分子能量,最小化,动力学计算[J]. 计算机化学学报,1983,Fastparallel算法的短程分子动力学[J]. 计算物理,1995,117(1): 1-19. 总计NAMD2: 更大的可扩展性并行分子动力学[J]. Journal ComputationalPhysics,1999,151(1): 283-312. 在万亿兆簇上的大分子分子动力学模拟的部署优化. 山东大学学报(科学版),2012,47. 收稿: 2012朱晓敏: 国家超级计算济南中心(山东省计算中心),研发部负责人,副研究员.

主要研究领域与空间分析算法和并行计算有关. 电子邮件: zhuxm@keylab.net元: 国家超级计算济南中心(山东省计算中心),副研究员. 他的主要研究领域是计算化学,计算生物学和计算机辅助药物设计. 电子邮件: shangy@sdas.org李: 国家超级计算济南中心(山东省计算中心),研究员. 他的主要研究领域是原子和分子物理学,计算化学和高性能计算. 电子邮件: wangl@sdas.org

本文来自电脑杂谈,转载请注明本文网址:

http://www.pc-fly.com/a/jisuanjixue/article-152426-2.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值