摘要:材料辐照效应的数值模拟计算是认识核材料服役性能的重要手段,基于超级计算机的大规模、高保真材料数值模拟计算会产生海量数值计算数据,如何针对数值计算大数据的特点,在实现其高效存储的基础上,通过挖掘总结辐照损伤机理和性能演化规律,对于核材料设计研发、核安全等具有重要意义。论述了材料数值计算大数据的定义及其本质特征,综述了近年来的相关工作。以自主研发的材料辐照效应分子动力学软件MISA-MD和随机团簇动力学软件MISA-SCD在国产超级计算机上的实际算例为基础,提出了一种适用于材料数值计算大数据的、多尺度关联与耦合的分布式数值计算大数据存储体系(NDSA);采用XGBoost算法实现了MD中Frenkel缺陷对数的精确预测,基于并查集算法实现了级联碰撞团簇的划分;基于密度聚类的方法对KMC数值计算大数据进行挖掘,发现了类环状团簇,实现了原子团簇的识别与分类;基于第一性原理数值计算大数据库对现有的势函数模型进行了改进,提出了新的势函数模型构建方法AIPM。最后对材料数值计算大数据的应用前景进行了展望。
关键词:法律判决预测 ; 判决要素抽取 ; 法条预测 ; 罪名预测 ; 刑期预测
1 引言
在材料辐照效应领域,高性能计算软件在模拟过程中会实时产生数值计算数据。这些数值计算数据不仅数目巨大、关联性强,而且不同计算尺度、不同服役环境下的数据之间是相互关联的。同时,这些数据中蕴含着材料从微观机理到宏观性能的规律,具有量大、关联复杂、类型丰富的典型大数据特征(如图1所示),是具有宝贵价值的。除了具有典型大数据特征,这些数据还具有领域特殊性。从反应堆材料生命周期的角度来看,首先,数据类