study
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
31、利用并行技术计算流体动力学过程
本文介绍了一种利用并行技术求解非等温多相流在裂缝性油藏中流动的数值方法。采用按物理过程分裂的有限体积法对控制方程进行离散,构建了隐式差分格式,并通过矩阵扫描法求解所得线性方程组。基于MPI标准在K100超级计算机上实现了并行计算,分析了不同进程数下的加速比与效率,确定了最优并行规模。计算结果展示了压力、温度和水饱和度的动态演化,验证了算法的有效性,为油井生产优化提供了理论依据。原创 2025-10-08 03:15:09 · 50 阅读 · 0 评论 -
30、高性能计算在地球物理与油藏模拟中的优化策略
本文探讨了高性能计算在地球物理与油藏模拟中的关键优化策略。一方面,针对弹性波传播代码,深入分析了GPU内存优化、多核架构性能比较及CPU/GPU开发优化规则,显著提升了计算效率;另一方面,针对非等温裂缝-多孔油藏的流体动力学过程,建立了基于质量与能量守恒的数学模型,并采用MPI实现矩阵扫描法的并行计算,有效缩短求解时间。文章还提供了详细的优化操作步骤、效果分析及未来研究方向,为复杂科学计算问题提供了高效解决方案。原创 2025-10-07 14:15:40 · 45 阅读 · 0 评论 -
29、地球物理代码在多核计算架构上的效率优化研究
本文研究了地球物理代码在多种多核计算架构上的效率优化方法,涵盖Intel Broadwell、KNL、IBM POWER9及NVIDIA GPU(Fermi、Kepler、Pascal)等平台。通过向量化、循环顺序优化、负载均衡、内存模式选择和线程块配置等手段,显著提升了弹性波传播模拟的性能。提出针对不同架构的优化规则,并结合基于本体的智能支持系统,实现算法、架构与并行代码生成的协同设计,有效简化高性能计算程序的开发流程。研究表明,架构定制化优化与智能系统辅助对提升地球物理数值模拟效率具有重要意义。原创 2025-10-06 12:53:11 · 50 阅读 · 0 评论 -
28、大规模并行系统的优化相对论代码:数据结构对并行效率的影响
本文探讨了在大规模并行系统中优化相对论流体动力学代码HydroBox3D的性能方法,重点分析了数据结构对SIMD并行效率的影响。通过从数组的结构(AoS)转向结构的数组(SoA),并结合英特尔SDLT库与OpenMP并行化技术,显著提升了代码在支持AVX-512指令集的CPU上的执行效率。测试结果表明,在至强6248R服务器上性能提升达50倍,工作站i9处理器上也实现20倍提升。文章还介绍了使用英特尔Advisor进行性能评估的方法,并展望了未来在AMD平台的适配与进一步优化方向。原创 2025-10-05 10:53:32 · 43 阅读 · 0 评论 -
27、超声无损成像的超级计算机技术
本文研究了一种基于单侧访问和底部反射波的超声层析成像方法,采用多级梯度迭代算法解决非线性反问题,实现了对焊接接头中小裂纹和空洞的高分辨率成像。通过标量波模型分离纵波,并结合残差泛函最小化与共轭问题梯度计算,提升了成像精度。数值模拟表明,该方法在低至20%、高达40%声速对比度下均能有效重建缺陷,且能克服结构噪声影响。同时对比了CPU与GPU平台的计算效率,结果显示GPU显著优于CPU,尤其适合大规模并行计算任务。未来可通过算法优化和硬件升级进一步拓展其在工业与医学领域的应用。原创 2025-10-04 14:58:55 · 54 阅读 · 0 评论 -
26、超级计算机在凝血因子XIIa抑制剂搜索及超声无损成像中的应用
本文探讨了超级计算机在两个重要领域的应用:一是通过分子对接与量子化学后处理搜索新型凝血因子XIIa抑制剂,发现了具有化学多样性的潜在抗凝剂;二是开发基于波动近似的超声断层成像技术,用于工业产品如核电站管道、输气管道等关键设施的无损检测。研究利用Lomonosov-2超级计算机完成大规模计算任务,结合SOL对接算法、PM7/COSMO方法和多阶段迭代重建算法,提升了药物筛选效率与缺陷检测精度。同时比较了CPU与GPU在逆问题求解中的性能差异,并展望了未来在算法优化、硬件升级和跨学科融合方面的发展方向。原创 2025-10-03 11:15:26 · 19 阅读 · 0 评论 -
25、大型稀疏系统求解与凝血因子XIIa抑制剂的超级计算搜索
本文探讨了两个前沿研究方向:一是基于大型稀疏线性系统的高性能求解,对比了USPARS与Intel® MKL PARDISO等求解器在不同硬件架构下的性能表现,涵盖内存使用、误差精度和并行可扩展性;二是利用超级计算技术对中国国家化合物库(CNCL)进行虚拟筛选,结合快速与标准对接策略及量子化学方法,成功识别出18种新型凝血因子XIIa抑制剂候选物。研究表明,这些化合物具有良好的化学多样性和潜在抑制活性,为开发更安全的抗凝药物提供了新路径。未来工作将聚焦于实验验证、结构优化与作用机制研究。原创 2025-10-02 16:09:12 · 23 阅读 · 0 评论 -
24、自由表面流体动力学模拟与稀疏线性方程组软件包
本文介绍了自由表面流体动力学模拟与稀疏线性方程组求解软件包USPARS的研究进展与应用。在流体模拟方面,基于SPH方法实现了小振幅波、非线性波及溃坝、海啸等复杂现象的数值模拟,并通过GPU并行化显著提升计算效率。USPARS软件包采用高斯消元法求解大型稀疏线性系统,支持多种矩阵类型的分解,结合矩阵重排技术降低内存消耗,并提供PyUSPARS和UFEAST等扩展功能,适用于科学计算与工程仿真。文章还分析了两者的技术优势与挑战,展望了未来在多平台兼容、算法优化及人工智能融合方向的发展前景。原创 2025-10-01 12:47:46 · 28 阅读 · 0 评论 -
23、基于GPU并行化的自由表面流体动力学模拟
本文提出了一种基于GPU并行化的自由表面流体动力学模拟方法,采用平滑粒子流体动力学(SPH)技术,结合高效的边界条件处理和并行排序算法,实现了对复杂非均匀地形上三维水动力流动的高精度模拟。模型准确描述了表面重力波的色散特性,并通过线性色散关系验证了数值解的准确性。利用CUDA和OpenCL实现GPU加速,显著提升了计算效率,尤其在大规模粒子模拟中表现出优越性能。通过波传播、边界条件验证及实际应用案例(如洪水与海岸结构相互作用),证明了该方法在水利工程和海洋工程中的广泛应用前景。原创 2025-09-30 10:53:34 · 30 阅读 · 0 评论 -
22、INM RAS地球系统模型的可扩展性研究
本文研究了INM RAS地球系统模型(INMCM6M)在不同MPI进程配置下的并行可扩展性,利用Mod ParProf工具分析大气、气溶胶和海洋模块的性能特征。研究表明,大气模型中子网格过程的时间分数随进程增加而降低,动力核心负载均衡良好,但与海洋模型的数据交换成为通信瓶颈;气溶胶模块计算速度较快,核心数可优化调整;海洋模型中MPI BCAST导致通信开销较高。通过工具验证和多配置对比,提出了优化数据交换、重新分配计算资源等改进建议,为提升耦合模型整体性能提供了指导。原创 2025-09-29 10:46:40 · 29 阅读 · 0 评论 -
21、地球系统模型的计算优化与可扩展性研究
本文研究了全球数值天气预报模型的代码优化与INM RAS地球系统模型(INMCM)的并行可扩展性。通过数组本地化和单精度移植显著降低了计算成本,提升了运行效率且不影响预报准确性。利用Mod ParProf和Perftools工具在Cray XC40-LC与INM RAS集群上分析INMCM6M的并行性能,找到了不同系统的最优配置,实现了高达75%的并行效率。研究表明,合理配置MPI进程和硬件升级可显著提升模型扩展性,为气候模拟与气象预测提供了高效计算支持。原创 2025-09-28 11:03:52 · 46 阅读 · 0 评论 -
20、SL - AV模型的降精度计算与内存优化
本文探讨了全球大气模型SL-AV在降精度计算与内存使用方面的优化策略。通过将辐射和重力波拖曳等参数化方案转换为单精度,显著减少了计算时间,同时保持预报精度基本不变。此外,通过控制向量长度和临时数组本地化等内存优化技术,提升了CPU缓存利用率,进一步加速了模型运行。实验表明,24小时预报耗时从22.5分钟降至21分钟,整体性能显著提升,为高效气象预报提供了技术支持。原创 2025-09-27 12:03:56 · 21 阅读 · 0 评论 -
19、《量子化学研究与全球大气模型计算优化》
本文探讨了量子化学方法在化合物结构与性质研究中的应用,以及全球大气模型SL-AV的计算效率优化。通过B3LYP和G4MP2等方法计算了多种四环化合物的生成焓和红外光谱,分析了结构对能量特性的影响,并比较了不同计算方法的精度与成本。同时,针对大气模型高计算开销的问题,采用单精度计算和内存优化策略,在不影响预报准确性的前提下显著提升了计算效率。文章进一步揭示了两类研究在计算方法选择、资源利用和精度-效率平衡方面的共性,提出了未来在更精确算法、多尺度模拟及人工智能应用等方面的发展方向。原创 2025-09-26 12:27:56 · 28 阅读 · 0 评论 -
18、三维非均匀TTI介质声波测井的并行数值模拟与量子化学研究
本文围绕三维非均匀TTI介质中的声波测井并行数值模拟与量子化学研究展开。在声波测井方面,采用Lebedev交错网格有限差分方案提高模拟精度,结合Neville插值算法处理r0轴奇点问题,并通过MPI实现高效并行计算,在128核系统上验证了良好的弱可扩展性。在量子化学方面,利用Gaussian 09软件计算三吡咯并三嗪类四环化合物的生成焓,分析结构与能量关系,评估其作为高能量密度材料的潜力。研究为复杂地质环境下的声波响应模拟和新型含能材料的设计提供了理论支持与技术路径。原创 2025-09-25 09:41:33 · 34 阅读 · 0 评论 -
17、3D 波流体动力学与声波测井数值模拟的并行计算研究
本文研究了3D波流体动力学与声波测井数值模拟中的并行计算方法。在3D波流体动力学方面,分析了波浪效应、湍流动能方程及SWAN模型的MPI与OpenMP并行实现,采用二维分解和自适应迭代算法提升计算效率。在声波测井方面,基于圆柱坐标系下的弹性动力学方程,结合局部网格细化、插值处理奇异性,并采用改进型PML(MPML)方法增强稳定性,通过空间分解与MPI实现高效并行。研究表明,并行计算显著提高了大规模模拟的效率与精度,适用于海洋工程和油气勘探领域。未来发展方向包括算法优化、硬件适配及多物理场耦合模拟。原创 2025-09-24 13:27:28 · 32 阅读 · 0 评论 -
16、多标准优化与三维波浪水动力学模型的并行计算
本文探讨了多标准优化与三维波浪水动力学模型在化学反应和海洋研究中的并行计算应用。针对烯烃加氢铝化反应,采用NSGA-II算法结合岛模型实现多标准区间优化,并通过并行计算提升效率;在三维水动力学方面,基于Navier-Stokes方程构建数学模型,利用SWAN进行近岸波浪模拟,并比较了OpenMP与MPI两种并行策略的性能。研究表明,MPI在扩展性和计算效率上优于OpenMP,但随着核心数增加,通信开销限制了加速比提升。未来需从算法优化、硬件发展和跨学科合作等方面进一步推动并行计算在复杂模型中的应用。原创 2025-09-23 16:31:26 · 35 阅读 · 0 评论 -
15、GPU加速伪谱求解器与化学反应多准则优化
本文探讨了GPU加速伪谱求解器与化学反应多准则优化两大主题。在GPU计算方面,介绍了基于CuPy和MPI实现的TARANG求解器,其利用GPU-FFT在单DGX系统中实现高效谱模拟,并在A100等GPU上展现出显著性能优势,较传统CPU提升达500倍。在化学反应优化方面,提出基于区间动力学模型的多准则优化方法,有效处理反应参数不确定性,以烯烃加氢铝化为例,通过定义温度、浓度等可变参数范围,结合遗传算法求解最优条件,提升产物产量与选择性。研究展示了高性能计算与化学工程优化的深度融合,具有重要的理论与应用价值。原创 2025-09-22 16:18:51 · 40 阅读 · 0 评论 -
14、如何在现代超级计算机上加速Lanczos - Montgomery方法及多节点GPU伪谱求解器
本文探讨了在现代超级计算机上加速Lanczos-Montgomery方法及多节点GPU伪谱求解器的关键技术。针对Lanczos-Montgomery方法,提出了CPU上的稀疏矩阵存储格式优化、密集运算改进,以及GPU上的高效实现与异步计算策略,显著提升了算法性能。同时,设计了基于平板分解的多节点多GPU FFT库,并应用于TARANG伪谱求解器,实现了高效的MHD湍流模拟。实验表明,该求解器在A100 GPU上比传统CPU实现快约500倍。未来工作将聚焦于通信优化、内存管理与算法融合,以进一步提升大规模科学原创 2025-09-21 14:12:34 · 25 阅读 · 0 评论 -
13、如何在现代超级计算机上实现快速的Lanczos - Montgomery算法?(上)
本文深入探讨了在现代超级计算机上高效实现Lanczos-Montgomery算法的关键技术,涵盖过滤、线性系统求解和平方根计算三大步骤。重点分析了基于INM RAS实现的并行块Lanczos-Montgomery方法的原理、实现细节与性能表现,包括矩阵分布策略、块因子优化、CSR存储格式选择及通信开销评估。通过RSA-232因式分解的实际案例,展示了该算法相较于传统方法的性能优势,并指出了在内存访问、通信效率和密集运算方面的优化空间。最后提出了未来在算法优化、硬件适配和并行计算技术融合等方面的发展方向。原创 2025-09-20 09:46:58 · 39 阅读 · 0 评论 -
12、GPU加速矩阵指数求解一维含时薛定谔方程及Lanczos - Montgomery方法在现代超级计算机上的应用
本文探讨了GPU加速矩阵指数方法在求解一维含时薛定谔方程中的应用,以及Lanczos-Montgomery方法在RSA-232因子分解中求解大规模稀疏线性系统的实现。基于HSE大学cHARISMa和Skoltech Zhores等现代超级计算机平台,研究展示了A100与V100 GPU在不同配置下的性能表现,分析了内存分配、分块策略、精度选择对计算效率的影响。同时,介绍了广义数域筛(GNFS)算法在RSA-232分解中的五个关键阶段,并突出并行块Lanczos-Montgomery方法在解决GF(2)上线性原创 2025-09-19 12:01:54 · 43 阅读 · 0 评论 -
11、场分裂比奥求解器与GPU加速矩阵指数法在不同问题中的应用
本文探讨了场分裂比奥求解器与GPU加速矩阵指数法在不同科学计算问题中的应用。场分裂比奥求解器采用直接(PARDISO)和迭代(BCGStab)方法,对比分析其在不同网格规模下的FLOPS、内存使用和可扩展性,结果表明迭代方法在大问题中性能更优且内存占用更低。GPU加速矩阵指数法基于多GPU GEMM算法,用于求解一维时变薛定谔方程,利用矩阵指数的虚部特性分离实虚部以优化计算,在大矩阵处理中接近理论峰值性能。两种方法分别适用于复杂多孔介质力学与量子动力学模拟,未来可进一步优化算法效率并拓展至三维问题。原创 2025-09-18 15:25:29 · 29 阅读 · 0 评论 -
10、高性能计算的效率与精度:从二氧化硅薄膜模拟到Biot方程求解
本文探讨了高性能计算中二氧化硅薄膜分子动力学模拟与准静态Biot方程求解的效率与精度问题。在GROMACS框架下,研究了PME方法中fourierspacing和插值阶数对模拟性能的影响,并分析了能量与压力张量的变化规律。针对Biot方程有限差分离散化产生的大型稀疏线性系统,比较了基于PARDISO的直接求解器与结合Field-Split预处理器的BCSGStab迭代求解器的性能。结果表明,直接求解器适用于小规模问题,而迭代方法在处理大规模问题时具有内存和效率优势。文章最后提出了参数选择、求解策略和并行优化原创 2025-09-17 16:24:36 · 30 阅读 · 0 评论 -
9、高效计算与模拟:从多线程闪蒸到薄膜静电能
本文探讨了多线程闪蒸计算与二氧化硅薄膜原子簇静电能模拟中的关键参数优化问题。通过分析不同状态方程(如立方EoS和CP-PC-SAFT EoS)在线程效率上的表现,提出针对简单与复杂模型的线程数选择建议,并结合初始猜测策略提升计算效率。在薄膜模拟方面,研究了PME阶数和fourierspacing参数对计算时间、并行效率及结果准确性的影响,指出在保证精度的前提下可通过调整参数平衡性能。文章进一步综合两者,构建参数优化决策流程,并通过实际案例展示了如何在复杂系统中协同优化闪蒸与静电能计算。最后展望了未来在高效算原创 2025-09-16 09:01:55 · 36 阅读 · 0 评论 -
8、CubicEoS.jl:相平衡计算的高效解决方案
本文介绍了CubicEoS.jl——一个基于Julia语言开发的高效相平衡计算工具包。该工具包支持立方状态方程和CP-PC-SAFT EoS两种热力学模型,采用BFGS拟牛顿法结合强回溯线搜索策略求解相稳定性和相分裂问题,在保证数值稳定性的同时提升了收敛速度。通过优化内存管理和实现自定义求解器,CubicEoS.jl在处理大规模VT闪蒸计算时表现出优异性能。文章详细阐述了模型约束、数值算法流程及多线程并行策略(‘冷’与‘热’模式)的实现与对比,并展示了在纯物质及多组分混合物上的应用结果,验证了其准确性和扩展原创 2025-09-15 10:35:01 · 48 阅读 · 0 评论 -
7、流体分析中的GSA应用与RAM需求及相平衡计算
本文探讨了全局稳定性分析(GSA)在二维层流、无限后掠翼及简化NASA通用研究模型(CRM)跨声速抖振预测中的应用,详细分析了不同流动问题下矩阵规模与RAM需求的关系,并基于计算实验总结了并行MPI进程数对内存及时钟时间的影响规律。同时,介绍了用于等温相平衡计算的开源软件CubicEoS.jl,其基于准牛顿法最小化亥姆霍兹自由能,适用于VT条件下的两相闪蒸求解。文中提供了GSA与相平衡计算的操作步骤、资源估算方法及优化建议,并展望了未来在计算资源提升和软件功能扩展方面的潜力。原创 2025-09-14 12:05:47 · 39 阅读 · 0 评论 -
6、迭代方法求解逆问题的计算效率与流体流动全局稳定性分析的矩阵形成方法
本文探讨了迭代方法在求解逆问题中的应用,重点介绍了多级方法(MSM)利用信号低频特性实现收敛的优势,以及波层析成像在医学、无损检测等领域的广泛应用。同时,文章详细分析了流体流动全局稳定性分析中的矩阵形成方法,包括基流求解、线性化处理、广义特征值问题的构建与求解,并比较了迭代与直接方法的优劣。研究采用直接方法结合SPEPc/PETSc和MUMPS工具进行大规模计算,评估了不同2D/3D流动问题的内存需求,并通过NTS代码验证结果可靠性。最后展望了该方法在医学、工程和地球科学领域的应用前景及未来优化方向。原创 2025-09-13 15:19:04 · 21 阅读 · 0 评论 -
5、超声断层成像逆问题求解方法及计算效率分析
本文探讨了超声断层成像中逆问题的求解方法,重点介绍了多阶段迭代法(MSM)如何通过从低频到高频逐步优化探测信号,克服传统梯度下降方法易陷入局部极小值的问题。该方法利用低频信号的线性特性确保初始收敛性,并在后续阶段提升分辨率,有效提高了图像重建精度和计算效率。文章还分析了在多核CPU和GPU等不同计算平台上的性能表现,表明MSM具有高度并行性,适用于现代高性能计算环境,在医学成像与无损检测领域具有广阔应用前景。原创 2025-09-12 12:21:53 · 21 阅读 · 0 评论 -
4、迭代方法求解逆问题的计算效率与块代数多重网格法
本文探讨了块代数多重网格法(BAMG)和多级迭代梯度法在求解复杂线性系统与超声断层成像逆问题中的应用。通过对比块Gauss-Seidel与BAMG方法,展示了BAMG在收敛速度和鲁棒性方面的优势,并分析了其在多种集群上的并行加速性能。同时,介绍了用于逆问题的多级迭代梯度法,强调频谱逐步扩展对避免局部极小值的作用。文章还展望了未知量缩减、特征分解及自适应AMG等未来发展方向,旨在提升大规模科学计算的效率与精度。原创 2025-09-11 16:08:06 · 30 阅读 · 0 评论 -
3、各种物理鞍点问题的块代数多重网格方法
本文介绍了一种用于求解多种物理问题中鞍点线性系统的块代数多重网格(Block AMG)方法。该方法基于Ruge-Stüben标量AMG框架,采用块高斯-赛德尔平滑器和多色排序实现并行化,并通过S3M库进行高效实现。针对两相油回收、三相黑油注气/注水、线性弹性、不可压缩弹性及比奥多孔弹性等问题进行了数值实验,结果表明该方法在减少迭代次数和提升求解效率方面表现良好,且具有较高的并行加速比。文章还分析了方法的优势与局限性,提出了未来在矩阵存储优化、粗空间选择和应用拓展方面的研究方向。原创 2025-09-10 16:28:37 · 31 阅读 · 0 评论 -
2、高性能计算在密封剂影响模拟中的应用
本文探讨了高性能计算在飞机装配过程中密封剂影响模拟的应用。通过建立包含流体-结构相互作用的数值模型,结合QP问题求解与雷诺润滑方程,分析了不同装配参数对密封剂流动和间隙闭合的影响。研究采用牛顿投影法和有限体积法进行数值求解,并利用HPC实现任务并行化,评估了不同模型规模下的并行效率。结果表明,紧固力、密封剂厚度和安装顺序显著影响装配质量,而合理的并行策略可显著提升计算效率,为实际工程问题提供了有效解决方案。原创 2025-09-09 10:52:49 · 29 阅读 · 0 评论 -
1、第九届俄罗斯超级计算日会议:聚焦超级计算前沿
第九届俄罗斯超级计算日会议(RuSCDays 2023)于2023年9月成功举办,汇聚全球超级计算领域专家,围绕超级计算技术的软硬件设计、工业应用、百亿亿次计算等主题展开深入交流。会议采用线上线下混合模式,共收录45篇高质量论文,涵盖超级计算机模拟与分布式计算等多个前沿方向。重点研究成果包括高性能计算在飞机装配密封剂影响模拟中的应用、块代数多重网格方法优化鞍点问题求解、逆问题迭代方法效率分析、流体稳定性分析中的内存优化策略、有向无环图调度算法基准测试等。会议展示了超级计算在科学、工业与社会发展中日益重要的作原创 2025-09-08 16:41:08 · 23 阅读 · 0 评论
分享