e1f2g
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
54、刚性体分子动力学与优化3D片上网络设计
本文探讨了刚性体分子动力学(RB)在DL POLY 4中的实现及其相对于约束键动力学(CB)的优势,包括更高的计算效率和更好的可扩展性。同时,文章还介绍了优化的3D片上网络(NoC)设计OPTNOC,其通过层间连接、网络结构和应用映射的综合优化,显著提升了多核心处理器的性能并降低了功耗。原创 2025-07-23 03:43:47 · 56 阅读 · 0 评论 -
53、网络传输与计算几何算法的优化探索
本文探讨了网络传输和计算几何领域的优化方法。第一部分介绍了TCP TIPS,一种具有主动拥塞避免功能的TCP变体,在多种网络环境中表现出高吞吐量、低延迟和良好的公平性。第二部分提出了一种用于解决计算几何复杂任务的统一算法平台,通过共享数据结构和‘分而治之’策略,实现了高效并行处理。研究表明,TCP TIPS在适应复杂网络变化方面具有优势,而统一算法平台在处理大规模几何任务时具备良好的通用性和性能。文章还对两者进行了对比分析,并展望了未来发展方向。原创 2025-07-22 13:52:44 · 36 阅读 · 0 评论 -
52、优化算法与网络协议:Enhanced DEEP与TCP TIPS的技术解析
本文深入解析了两种关键技术:Enhanced DEEP优化算法和TCP TIPS网络协议。Enhanced DEEP结合了并行差分进化和改进的DEEP方法,通过新的选择规则和个体替换策略,有效解决了多目标函数优化问题,尤其在生物系统建模中表现出色。TCP TIPS则是一种主动拥塞避免协议,通过分析数据包时间间隔提前检测网络拥塞,提高了带宽利用率并减少了传输延迟,适用于实时通信等对延迟敏感的应用场景。文章还探讨了两种技术的未来发展方向,包括与人工智能的结合以及在5G网络中的应用前景。原创 2025-07-21 10:33:39 · 39 阅读 · 0 评论 -
51、MathCloud平台与增强型DEEP方法:科学应用的新突破
本文介绍了MathCloud平台和增强型DEEP方法在科学计算与生物医学应用领域的新突破。MathCloud平台通过RESTful Web服务提供轻量级且高效的解决方案,支持分布式计算、工作流开发及多领域的应用案例,如病态矩阵求逆、X射线衍射数据解释和优化建模。增强型DEEP方法改进了传统的差分进化算法,通过多目标优化和并行计算提高了生物医学模型参数求解的鲁棒性与效率。两者结合为未来科学研究和实际应用提供了创新工具和方向。原创 2025-07-20 13:39:44 · 30 阅读 · 0 评论 -
50、MathCloud:以RESTful Web服务实现科学应用的发布与重用
本文介绍了MathCloud平台,该平台通过统一的RESTful Web服务接口实现科学应用的发布与重用。平台包含服务容器、服务目录、工作流管理系统等核心组件,解决了科学计算领域软件复用困难、高性能计算资源使用门槛高、应用集成与互操作性差等问题。文章详细描述了平台架构,并通过实验评估了其性能,同时与其他相关平台进行了对比,展示了MathCloud的优势和未来发展方向。原创 2025-07-19 09:09:32 · 30 阅读 · 0 评论 -
48、二维阵列同步算法解析
本文深入解析了用于二维矩形阵列同步的算法A及其广义扩展。算法A能够在最优时间内实现同步,适用于不同尺寸和形状的阵列,并通过信号传播与反射机制确保所有行和列同时同步。广义算法进一步扩展了应用场景,允许初始将军位于阵列的任意位置,并通过阵列分解、标记、信号传播和最终同步四个阶段完成操作。文章还探讨了同步算法在并行计算、分布式系统和通信网络中的应用及其优势,并对算法的时间复杂度和空间复杂度进行了评估,验证了其高效性和可靠性。原创 2025-07-17 14:19:52 · 47 阅读 · 0 评论 -
47、二维最优时间FSSP算法解析
本文介绍了一种能够在最优时间内实现二维数组同步的FSSP算法。该算法通过将二维数组分解为四个子数组,进行递归减半标记,寻找中心点,并最终实现同步。文章详细解析了算法的四个阶段:数组分解、标记阶段、寻找中心点和最终同步,并展示了算法的操作步骤和效果。这种算法在并行计算和图像处理等领域具有广泛的应用价值。原创 2025-07-16 15:32:34 · 25 阅读 · 0 评论 -
46、行人渗透分析与二维细胞自动机同步算法研究
本文探讨了行人渗透分析在车站人群控制中的应用,以及二维细胞自动机的最优时间同步算法。通过模拟不同人群密度下的行人流动情况,提出了一种基于间隔控制的拥堵缓解策略,并给出了最优间隔时间的计算方法。此外,研究还提出了一种新的基于递归二分标记的二维FSSP同步算法,该算法具有各向同性、正确性易验证和可扩展性等优势,适用于大规模网络同步。这些方法在实际场景中具有广泛的应用价值,能够有效提升人群管理和系统同步的效率。原创 2025-07-15 12:16:58 · 34 阅读 · 0 评论 -
45、基于自然启发算法的图像重建与行人渗透分析
本研究探讨了基于自然启发算法的图像重建与行人渗透分析。在图像重建方面,利用遗传算法(GA)搜索细胞自动机(CA)规则,通过训练和测试阶段的实验,证明了该方法能够有效恢复受损图像。在行人渗透分析方面,通过细胞自动机建模,分析了行人间隔对队列长度、行人通量等指标的影响,并引入效用函数找到最优行人间隔,为人群管理提供了有效的解决方案。两个研究领域在规则搜索机制和适应度评估方面具有相似的方法论,同时在应用价值上具有互补性。研究结果为图像处理和人群管理提供了有益的参考。原创 2025-07-14 16:08:46 · 31 阅读 · 0 评论 -
44、生物系统模拟与图像重建的创新算法探索
本文探讨了生物系统模拟与图像重建领域的创新算法。重点介绍了基于CUDA的高效生化系统模拟工具cupSODA,其通过GPU并行计算和内存优化显著加速了生物系统模拟过程;同时介绍了一种结合细胞自动机和遗传算法的图像重建方法,为处理图像信息缺失问题提供了新思路。文章还分析了两种方法的应用场景、优势及未来发展方向。原创 2025-07-13 09:57:06 · 33 阅读 · 0 评论 -
43、cupSODA:基于CUDA的质量作用动力学模拟器
本文介绍了cupSODA,一种基于CUDA的高效生物系统模拟工具,利用GPU加速质量作用动力学模型的确定性模拟。通过自动从生化反应推导ODE系统并使用LSODA算法进行数值积分,cupSODA能够在大规模并行模拟中显著提升计算效率,适用于参数扫描、灵敏度分析等需要大量模拟的场景。测试结果表明,在复杂生物模型和大规模模拟任务中,cupSODA相比传统CPU模拟器具有显著的加速优势。原创 2025-07-12 13:01:06 · 27 阅读 · 0 评论 -
42、稳定模式形成的TCA模型并行实现及生物系统模拟研究
本文研究了基于稳定模式形成的TCA模型的并行实现及其在多孔介质模拟中的应用,同时探讨了生物系统模拟工具cupSODA的高效计算能力。通过全细胞自动机与第二层细胞自动机的并行组合,成功模拟了具有复杂结构的多孔材料,并提出了块同步模式以提高并行效率。实验表明,该模型在不同处理器数量下具有良好的扩展性。在生物系统模拟方面,cupSODA利用GPU加速实现了比CPU快112倍的模拟效率,为生物研究提供了强大支持。原创 2025-07-11 12:22:43 · 42 阅读 · 0 评论 -
41、三角网格中全对全通信的元胞自动机代理速度更快
本研究探讨了三角网格(T-grid)和方形网格(S-grid)中元胞自动机(CA)代理在全对全通信中的表现,以及总istic元胞自动机(TCA)稳定模式形成的并行实现方法。研究发现,T-grid中的代理通信速度普遍快于S-grid,但部分初始配置可能导致速度下降。同时,通过TCA与异步CA(ACA)的并行组合,结合块同步转换策略,成功实现了高效的三维并行计算,并验证了转换的合理性。研究为提升代理通信效率及模拟复杂系统自组织现象提供了新思路。原创 2025-07-10 13:43:02 · 36 阅读 · 0 评论 -
40、多智能体通信与并行计算优化研究
本研究探讨了多智能体系统在方形网格和三角网格中的全对全通信任务,通过元胞自动机建模和遗传算法优化,设计了能够高效完成通信任务的有限状态机智能体。实验结果表明,三角网格中的智能体通信效率显著优于方形网格,同时提出了通过调整初始控制状态提升智能体可靠性的方法。研究为优化多智能体系统的通信性能和推动其实际应用提供了重要理论支持。原创 2025-07-09 10:36:00 · 64 阅读 · 0 评论 -
39、3D 心脏建模与 MakkSim 行人模拟器并行计算探索
本文探讨了3D心脏建模与MakkSim行人模拟器在并行计算方面的应用与挑战。3D心脏建模通过GPU加速显著提高了模拟效率,特别是在大规模网格计算中表现突出;而MakkSim行人模拟器则分析了多种并行计算方案,其中并行代理更新方案显示出较大潜力。两者在提升计算性能的同时,也面临着参数估计、区域识别算法及密度场更新等挑战。未来的研究将聚焦于优化参数估计技术、改进区域识别算法以及解决高密度情况下的计算瓶颈问题。原创 2025-07-08 13:42:20 · 31 阅读 · 0 评论 -
38、基于细胞自动机的复杂图像与3D心脏建模研究
本文探讨了基于细胞自动机的复杂图像时间脉冲描述方法,以及结合细胞自动机、质量-弹簧系统和CUDA并行计算的3D心脏建模技术。细胞自动机在图像识别中表现出类别无限扩展、高速响应和高识别率的优势。3D心脏建模通过模拟动作电位传播和组织机械行为,实现了高效的电-机械耦合模拟,并考虑了缺血细胞等病理情况。研究展示了这些方法在图像处理和心脏疾病研究中的广泛应用前景。原创 2025-07-07 15:55:31 · 30 阅读 · 0 评论 -
37、3D 元胞自动机在流体渗透与复杂图像识别中的应用
本文探讨了3D元胞自动机在流体渗透与复杂图像识别中的应用。在流体渗透模型中,通过顺序和并行版本的实现,研究了水在多孔介质中的渗透特性,包括渗透速率、蒸发与亲水夹杂物的影响。在图像识别领域,基于元胞自动机的系统能够高效提取图像特征,并通过脉冲序列描述场景,实现对旋转和缩放不变性图像的准确识别。研究展示了元胞自动机在处理复杂问题中的高效性与灵活性,并展望了其未来在多领域的发展潜力。原创 2025-07-06 13:34:43 · 45 阅读 · 0 评论 -
36、细胞自动机模型在生物种群与流体渗透模拟中的应用
本文介绍了细胞自动机模型在两个不同领域的应用:贝加尔湖生物种群动态模拟和多孔材料中流体渗透的3D模拟。贝加尔湖模型考虑了空间分布、季节性出生率、栖息地污染和水流的影响,能够模拟捕食者-猎物关系及种群动态变化。流体渗透模型则模拟了对流、扩散、亲水性和蒸发等过程,适用于复杂多孔结构中的流体运动研究。文章对比了两种模型的特点,分析了其应用领域及挑战,并展望了细胞自动机模型未来的发展趋势,包括与其他方法的融合、智能化提升以及应用领域的扩展。原创 2025-07-05 14:27:24 · 32 阅读 · 0 评论 -
35、由于提供的内容仅“以下”二字,没有具体信息,无法按照要求生成博客,请提供第35章的详细英文内容。
由于提供的内容仅包含“以下”二字,没有具体的第35章英文内容,无法生成有效的博客信息。请提供详细的英文内容,以便生成完整的博客简介和关键词。原创 2025-07-04 09:49:25 · 29 阅读 · 0 评论 -
34、SkelCL:用于多GPU系统高级编程的OpenCL增强方案
本文介绍了SkelCL,一种基于OpenCL的多GPU系统高级编程解决方案。SkelCL通过引入并行容器数据类型、自动数据分布机制和预定义的算法骨架,简化了多GPU环境下的开发复杂性。与底层的OpenCL相比,SkelCL显著减少了代码量,提高了开发效率,并屏蔽了内存管理、数据传输和并行性表达等底层细节。文章详细描述了SkelCL的核心特性、编程模型、典型应用场景以及其相较于OpenCL的优势。原创 2025-07-03 11:12:50 · 54 阅读 · 0 评论 -
33、基于伪随机数生成器选择的耗散粒子动力学高效区域分解
本文研究了通过引入一种新的伪随机数生成器(PRNG)Saru,以提高耗散粒子动力学(DPD)模拟软件DL MESO的并行可扩展性。Saru具有快速播种和三变量种子预混合算法,能够在不同处理器核心上为同一粒子对生成相同的随机数,从而消除了边界粒子对力计算所需的力导入通信步骤。测试结果表明,改进后的Saru - II版本在多数情况下显著提升了性能,尤其在大规模并行计算中表现突出。未来计划在DL MESO的新版本中集成这一改进,并进一步优化内存访问和键相互作用的簿记机制以提升可扩展性。原创 2025-07-02 14:25:14 · 51 阅读 · 0 评论 -
32、高性能计算新方案:集群服务与SeloGPU框架解析
本文介绍了两种高性能计算的新方案。首先提出了一种基于数据流的‘集群即服务’接口,通过任务控制系统WBS实现用户工作流程的自动化处理,提升多处理器系统的计算效率。随后详细解析了SeloGPU框架,这是一种支持选择性GPGPU远程卸载的解决方案,通过卸载管理器与OpenCL目标节点的协作,结合API预执行、合并、重叠传输和异步处理等优化技术,有效降低网络开销,提高执行效率。实验结果验证了该框架在不同工作负载下的性能优化效果,为高性能计算资源的灵活利用提供了新思路。原创 2025-07-01 15:21:07 · 29 阅读 · 0 评论 -
31、并行处理与数据流导向的集群任务执行
本文探讨了并行处理和集群计算中的任务性能评估和数据流导向的用户任务执行方法。首先介绍了基于连续时间马尔可夫链(CTMC)的资源分配策略性能评估,量化了工作负载和加速比变化的影响。随后重点描述了WBS系统的设计与实现,该系统提供了一个用户友好的数据流导向环境,支持集群上科学计算任务的高效执行。文章详细说明了WBS的架构、数据流接口、数据库实现及两个实际应用示例,展示了其在提高计算效率和增强用户体验方面的优势。原创 2025-06-30 11:26:07 · 28 阅读 · 0 评论 -
30、并行计算中的队列、任务调度与编程模型
本文探讨了并行计算中的三个核心主题:快速可扩展的无锁 k-FIFO 队列、连续力学问题的两级编程模型以及并行处理器上的在线可并行任务调度。通过实验与分析,文章展示了动态调整 k 值的队列性能优势、适用于多核与 GPU 的两级并行计算模型,以及基于贪心策略和马尔可夫链的任务调度方法。这些方法不仅在各自领域表现优异,同时具备高性能、可扩展性和动态适应能力,为未来复杂并行系统的开发与优化提供了理论支持和实践指导。原创 2025-06-29 15:01:37 · 42 阅读 · 0 评论 -
29、快速可扩展的无锁 k-FIFO 队列
本文深入探讨了 BS 和 US k-FIFO 队列算法,分析其在高并发场景下的性能与可扩展性,并与其他主流并发数据结构(如标准基于锁的 FIFO 队列、无锁 Michael-Scott 队列等)进行了对比。通过在 40 核服务器上的多线程基准测试,评估了 k 值对性能的影响,并提出了动态调整 k 值以优化性能的 PID 控制器方案。实验结果表明,BS 和 US k-FIFO 队列在生产者-消费者场景、Mandelbrot 集计算以及图算法中均表现出色,尤其在高竞争和高并发环境下具有显著优势。此外,本文还展望原创 2025-06-28 12:01:31 · 32 阅读 · 0 评论 -
28、快速可扩展的无锁 k-FIFO 队列技术解析
本文介绍了一种快速可扩展的无锁 k-FIFO 队列技术,适用于并行共享内存硬件环境。文章提出两种算法,分别实现有界大小(BS)和无界大小(US)的无锁 k-FIFO 队列,并支持可线性化的空(和满)检查功能。通过 k-段的设计,算法能够在多个线程并发执行时保持高效性能和良好的可扩展性。实验表明,存在最优的 k 值使得性能最佳,同时原型控制器可动态调整 k 值以适应运行时负载变化,进一步提升性能。该算法在多线程任务调度、数据缓存系统和分布式系统中具有广泛应用前景。原创 2025-06-27 16:22:41 · 75 阅读 · 0 评论 -
27、DISBench:多核多处理器内存性能评估的开源基准测试工具
本文介绍了DISBench,一个用于多核多处理器系统内存性能评估的开源基准测试工具。DISBench包含流、步长和随机三种合成内核,支持加载、存储和加载-修改-存储三种内存操作,并通过POSIX线程库实现多线程执行。该工具支持线程绑定、NUMA内存分配控制以及硬件性能计数器集成,便于深入性能分析。文章还对英特尔Sandy Bridge-EP和AMD Interlagos处理器的内存子系统进行了详细评估,展示了不同内存访问模式下的性能表现。DISBench为数据密集型应用的开发和硬件优化提供了有价值的参考。原创 2025-06-26 12:33:14 · 55 阅读 · 0 评论 -
26、基于计算性能模型的通用数据分区框架 FuPerMod 解析
本文介绍了基于计算性能模型的通用数据分区框架 FuPerMod,详细解析了其在异构平台上实现高效数据并行应用优化的方法。框架提供了静态与动态数据分区算法,支持多种性能模型,适用于不同应用场景。通过性能测量、模型构建和自适应负载均衡,提升应用性能和资源利用率。原创 2025-06-25 13:25:53 · 37 阅读 · 0 评论 -
25、服务验证与数据分区优化:技术解析与框架应用
本文深入探讨了服务验证与数据分区优化的关键技术,并介绍了相关框架的应用。在服务验证部分,分析了服务合规性与安全性的验证方法,并指出其属于安全属性的范畴。在数据分区优化方面,对比了现有数据分区软件的特点,提出了在异构HPC平台上的优化挑战,并介绍了一种新的数据分区框架FuPerMod。该框架支持多种计算性能模型,能够实现高效的数据分区与动态负载平衡,适用于多种异构计算平台。文章最后通过并行矩阵乘法和雅可比方法的案例展示了框架的实际应用效果。原创 2025-06-24 09:27:40 · 58 阅读 · 0 评论 -
24、安全无故障服务的规划与验证技术
本文探讨了如何通过静态分析和服务合规性检查技术来构建有效计划,以确保服务网络的安全和无故障运行。文章介绍了历史表达式的形式化定义及其操作语义,定义了有效计划的条件,并提出了通过投影函数、观察就绪集和产品自动机来验证服务合规性的方法。此外,还讨论了实际应用中的注意事项以及未来研究的方向。原创 2025-06-23 16:07:47 · 30 阅读 · 0 评论 -
23、并行算法在服务优化与安全验证中的应用
本文探讨了并行全局搜索算法在支持向量机(SVM)回归参数优化中的应用,以及形式化的合同理论在服务合规性和安全性验证中的作用。通过实验展示了并行算法在优化计算效率方面的显著优势,并结合酒店预订服务示例,说明了合同理论在服务交互中的安全验证过程。此外,还介绍了服务交互的可视化流程,并分析了并行算法与服务验证的综合应用场景,包括金融风险评估、医疗诊断和智能交通等。原创 2025-06-22 10:50:09 · 68 阅读 · 0 评论 -
22、SVM回归参数优化:并行全局搜索算法的应用
本文探讨了基于并行全局搜索算法的SVM回归参数优化方法,重点分析了如何通过将多维优化问题转化为一维问题以提高计算效率。文章比较了不同并行算法实现的性能,并通过实验验证了组合并行全局搜索算法在迭代次数和求解时间上的显著优势。同时,分析了平移扫描和旋转扫描的局限性,并提出了改进方向。原创 2025-06-21 10:13:20 · 27 阅读 · 0 评论 -
21、分布式并行计算与处理器能耗可视化技术探索
本文探讨了分布式并行计算、处理器能耗可视化以及支持向量机回归参数优化等关键技术的研究进展与应用。文章重点分析了MapReduce与MPI结合在异构系统上的应用,PowerVisor工具在处理器能耗和散热动态可视化中的作用,并行全局搜索算法对SVM回归参数优化的提升。此外,还总结了这些技术的功能特点、适用场景及其未来发展趋势,为高性能计算和能效优化提供了技术参考。原创 2025-06-20 10:02:58 · 40 阅读 · 0 评论 -
20、高性能计算:混合个人计算系统与分布式并行计算的研究进展
本文探讨了高性能计算领域中的两项关键技术:基于GPU处理器的混合个人计算系统和利用MapReduce/MPI实现的分布式并行计算。研究分析了混合计算系统中RAM容量和时钟频率对性能的显著影响,并探讨了MapReduce与MPI在解决石油开采问题中的协同作用。文章还比较了相关研究,并总结了系统优化和算法改进的关键操作步骤。未来的研究方向包括系统组件优化、负载平衡算法改进和新兴技术的结合应用。原创 2025-06-19 10:26:13 · 38 阅读 · 0 评论 -
19、计算参数化完美嵌套循环依赖关系并集的传递闭包
本文提出了一种用于计算参数化完美嵌套循环中依赖关系并集的传递闭包的新方法。该方法通过将参数化依赖距离向量转换为常数向量的线性组合,构建矩阵并寻找其基,从而计算出传递闭包或其近似。此方法在多项式时间内完成大部分步骤,显著降低了计算复杂度,尤其适用于并行处理和编译器优化领域。实验结果表明,该方法在处理复杂循环时具有良好的性能和准确性,为提取程序并行性提供了高效支持。原创 2025-06-18 14:32:34 · 41 阅读 · 0 评论 -
18、分布式计算中的时隙选择算法解析
本文探讨了分布式计算中的时隙选择算法,重点分析了不同算法方案的特点、优势和适用场景。对比了MinFinish、MinCost和MinProcTime等算法在时间、成本和资源利用效率方面的表现,并介绍了AEP算法在调度过程中的优势。文章还探讨了未来优化资源共同分配算法的方向,包括算法优化、策略集成和实验验证,旨在提高分布式计算的调度效率和资源利用率。原创 2025-06-17 15:20:42 · 37 阅读 · 0 评论 -
16、分布式计算中的时隙选择算法:AEP 方案及其实验研究
本文详细介绍了分布式计算中的时隙选择算法——AEP(Alternative Effective Window Search)方案及其多种实现方法,包括AMP、MinFinish、MinCost、MinRunTime等。通过对不同标准下的算法性能进行实验分析,比较了它们在平均开始时间、运行时间、完成时间、总执行成本等方面的优劣。文章还探讨了实际应用中如何根据具体需求选择合适的算法,并对未来研究方向进行了展望。原创 2025-06-15 13:44:25 · 27 阅读 · 0 评论 -
15、多核环境下的数据包分类算法及分布式计算中的时隙选择算法
本文探讨了多核环境下的数据包分类算法和分布式计算中的时隙选择算法。在多核数据包分类部分,对比了不同设计方案的性能,分析了规则集大小、搜索算法、合并表示方法等因素对吞吐量和延迟的影响。实验表明,基于范围树和位向量表示的方法性能更优。在分布式计算方面,提出了新的时隙选择算法 AEP,该算法具有线性复杂度,并支持用户定义的优化标准,通过模拟实验验证了其在调度效率、资源利用率和执行成本方面的优势。最后,文章展望了未来研究方向,包括算法优化、跨领域融合及结合新兴计算环境的应用。原创 2025-06-14 13:31:53 · 35 阅读 · 0 评论 -
14、基于分解的多核心数据包分类算法实现
本文探讨了基于分解的多核数据包分类算法的实现方法。重点介绍了预处理、搜索和合并三个阶段,并比较了线性搜索与范围树搜索、规则ID集合并与位向量合并等不同实现方式的性能。实验结果表明,在多核处理器上,基于分解的算法能够有效提高数据包分类的吞吐量和降低处理延迟,其中RBV方法表现最优。研究还分析了数据移动、缓存性能和线程数量对整体性能的影响,为未来优化高性能网络系统提供了参考。原创 2025-06-13 14:46:59 · 34 阅读 · 0 评论 -
13、超算互连性能的深入剖析与应用指南
本文深入剖析了超级计算机互连性能的关键指标,包括聚合节点带宽、二分带宽、集体操作延迟、光晕交换延迟以及计算与通信重叠等内容。通过对Intrepid、Mira、Eureka和Magellan等超算系统的基准测试数据,分析了不同互连技术(如BG/Q和BG/P)在消息传递、通信带宽和延迟方面的表现,并提出了针对科学计算应用的优化策略和操作建议,旨在提升高性能计算应用的效率。原创 2025-06-12 15:28:01 · 53 阅读 · 0 评论
分享