- 博客(1156)
- 收藏
- 关注
原创 MPI Sessions 完整介绍+使用
MPI Sessions 是MPI-4.0 新一代并行执行模型,彻底替代传统全局初始化模型,专门解决多物理场耦合、多求解器独立运行、动态资源划分、异构GPU/CPU分区、FSI液固耦合等复杂场景。结合你之前学的MPI Partitioned分区通信、CUDA-aware GPU通信,本文一次性讲清原理、API、标准流程、FSI双向流固耦合完整工程实现。模块作用FSI耦合用途独立MPI环境流体/固体分开初始化Pset进程集划分逻辑进程组区分流体GPU进程、固体CPU进程创建独立通信器。
2026-04-22 10:01:48
347
原创 MPI: Partitioned 分组通信(分区点对点通信)
必须传GPU原始device指针,不能传CPU拷贝指针只能CPU单线程调用,不能GPU调用必须确认GPU分区写完,再调用MPI_PreadyOpenMPI旧版本CUDA-aware不支持Partitioned,必须≥5.0分区编号必须0~N-1连续,不能乱序、重复Pready。
2026-04-22 09:58:06
460
原创 HPC-X(NVIDIA)介绍
NVIDIA HPC-X 并不是一个孤立的 MPI 变体,而是一个由 NVIDIA (原 Mellanox) 提供的高性能通信软件工具包。[1, 2]它通过将开源组件与专有加速技术“打包”并进行深度调优,为基于 InfiniBand 网络的集群提供极致性能。[3, 4]
2026-04-21 11:13:36
372
原创 CEEC(Centre of Excellence in Exascale CFD)介绍
欧洲超算 CFD 旗舰:把传统CFD推向百亿亿次工业+学术双驱动:兼顾基础算法与工程应用全链路覆盖:代码→算法→硬件适配→工业验证开源开放:所有改进回馈社区,可直接用于你的相变/沸腾/冷凝研究欧洲CFD全面上Exascale:5大旗舰代码GPU化+千万核+低能耗相变/多相流工业化沸腾/冷凝/凝固从实验室走向百亿亿次工程开源回馈:所有优化合并回主线工业落地:6大领域达TRL 4–5,直接用于航空、能源、船舶、航天。
2026-04-16 19:26:25
372
原创 FrontISTR 有限元项目介绍与使用
FrontISTR 是日本开源、大规模并行非线性结构有限元求解器,主打超算/集群高效并行,适合大模型、非线性、高算力需求场景,MIT 协议可商用二次开发。FrontISTR(开源大规模并行非线性结构有限元程序)开发背景:日本文部科学省下一代 IT 基盘仿真软件项目成果维护主体:FrontISTR Commons 社团MIT 开源许可,个人/商用/二次开发自由超大规模并行、强非线性、超算/集群友好、GPU 可加速。
2026-04-15 08:09:26
331
原创 markitdown介绍和使用
一、MarkItDown 是什么MarkItDown 是微软 AutoGen 团队开源的 Python 工具(MIT 协议),核心是把 PDF/Word/PPT/Excel/图片/音频/HTML 等 20+ 格式,一键转成结构完整的 Markdown。专为 LLM / RAG / 知识库 设计:保留标题、列表、表格、链接、图片 OCR、语音转写。二、核心支持格式三、安装(一行命令)bash。
2026-04-14 04:51:18
534
原创 TCLB(CUDA Lattice Boltzmann)项目介绍
TCLB(CUDA Lattice Boltzmann)是一款基于格子玻尔兹曼方法(Lattice Boltzmann Method, LBM)的高性能计算流体动力学(CFD)仿真代码,由华沙理工大学的 Zakład Aerodynamiki 团队主导开发,核心目标是为复杂物理场计算和新模型实现提供高效、灵活的框架。
2026-04-12 21:28:49
409
原创 MVAPICH介绍
发起:2001 年,由 Prof. Dhabaleswar K. (DK) Panda 团队主导定位:基于 MPICH 架构(ADI3 通道),专注RDMA 网络 + HPC 场景的高性能 MPI 库BSD 开源许可(商用友好)现状:全球超 3200 家机构、89 个国家使用,大量 TOP500 超算采用MVAPICH 是RDMA 网络 HPC 的性能标杆,在 InfiniBand/GPU 超算场景下几乎是默认首选;MPICH 是标准基石,OpenMPI 是通用全能选手。
2026-04-06 08:33:28
223
原创 numactl介绍和使用
跨节点访问内存延迟高(本地 ~10,跨节点 ~20–30)。:多路服务器(多 CPU 插槽)下,每个 CPU Socket 对应一个。内存不足则分配失败(适合确保本地访问)
2026-04-05 17:35:09
164
原创 Georg Hager: HPC领域顶级专家学者
Georg Hager = HPC性能优化领域的“宗师”他以LIKWID、ECM模型、Node-Level Performance Engineering三大里程碑,定义了现代HPC性能工程的方法论与工具链,是全球超算与科学计算开发者必须了解、学习、致敬的标杆人物。
2026-04-05 16:13:37
257
原创 LIKWID: 轻量版拓扑+绑核+性能计数器三合一工具
LIKWID = 轻量版拓扑+绑核+性能计数器三合一工具是HPC开发者快速定位NUMA/线程/缓存/功耗瓶颈的首选工具,无依赖、零侵入、见效快。
2026-04-05 15:40:55
293
原创 《孙子兵法》职场核心应用解析:从谋略到执行,适配职场全场景
孙子兵法》的职场价值,在于它为我们提供了一套**“高维度的思维方式”**:从战略的高度看待职业发展,从谋略的角度解决工作问题,从人心的角度处理人际关系。对于普通员工,它是立身职场的生存智慧,教会你如何提升核心竞争力、把握机会、规避风险;对于管理者,它是带团队的核心心法,教会你如何凝聚团队、激励下属、打造高执行力团队;对于所有人,它是一套终身受用的底层逻辑,教会你如何以最小的成本达成目标,以巧胜而非力胜,顺势而为而非蛮干。
2026-03-26 14:08:41
414
原创 孙子兵法·谋攻篇
故君之所以患于军者三:不知军之不可以进而谓之进,不知军之不可以退而谓之退,是谓縻军;不知三军之事,而同三军之政者,则军士惑矣;不知三军之权,而同三军之任,则军士疑矣。三军既惑且疑,则诸侯之难至矣,是谓乱军引胜
2026-03-26 13:56:02
338
原创 西蒙学习法(Simon Learning Method,又称锥形学习法)
西蒙学习法的本质是用科学策略替代盲目努力先定准目标,再拆成小块,然后高强度专注攻克,最后用反馈迭代巩固。它不是“捷径”,而是一套可复制、可落地的高效学习系统,帮你在信息爆炸时代,把时间转化为真正的能力。
2026-03-24 06:45:47
386
原创 Fortran2003关键字final介绍
final:类型绑定关键字,用于声明该类型的最终子程序。:用户定义的子程序,在对象被“终结”(finalized)时自动调用,负责资源清理。触发时机:对象离开作用域、被重新赋值、被deallocate、作为形参时。局部对象离开作用域:函数/子程序/block 内声明的非指针、非可分配对象,退出时自动 final。可分配对象被 deallocate时触发。对象被重新赋值(intrinsic assignment):赋值语句obj = expr执行前,先 final 旧值。
2026-03-24 06:43:05
375
原创 FlyCut Caption视频字幕工具介绍
本地 AI 识别:基于 OpenAI Whisper,在浏览器本地运行,不上传视频,保护隐私。字幕+剪辑一体化:编辑字幕片段 → 自动裁剪视频,所见即所得。多语言支持:支持中文、英文、日文等数十种语言。多格式导出:SRT/VTT/JSON 字幕 + 带字幕视频。技术栈:React 19 + TypeScript + Vite + WebAssembly,高性能、跨平台。
2026-03-24 06:29:40
449
原创 重叠网格(Overset/Chimera Grid)处理技术:开源资源与学术文献指南
部分 NASA 和 AIAA 论文可能需要机构订阅才能下载全文。建议使用 Google Scholar (https://scholar.google.com) 搜索论文标题,常可找到作者主页上的预印本版本。
2026-03-03 12:06:37
640
原创 Fortran: Python实现UDF(User Defined Function)逻辑流程
fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;无有Fortran: 准备必要数据将数据挂载至全局字典 simulator调用 Python 入口: udf_dispatcher执行对应 UDF 函数注册表检索函数名?执行默认调试函数从 simulator 读取输入数据执行计算并将结果写入 simulator。
2026-02-09 17:36:28
1215
原创 MPI学习资源
MPI Self-Study MaterialsIntroduction to the Message Passing Interface (MPI)Rolf Rabenseifner rabenseifner@hlrs.deUniversity of Stuttgart High-Performance Computing-Center Stuttgart (HLRS)
2026-02-09 13:11:23
139
原创 PyVista 全景指南
启用 PBR(Physically Based Rendering)材质actor.prop.metallic = 0.2 # 金属度 0-1actor.prop.roughness = 0.5 # 粗糙度 0-1# 添加环境光遮蔽(AO)提升深度感plotter.enable_anti_aliasing('ssaa') # 超采样抗锯齿plotter.enable_shadows() # 投影阴影# 自定义光源数据预处理:在 PyVista 外完成计算(NumPy),仅用其可视化。
2026-02-07 10:39:08
797
原创 Graphviz 全景指南
场景推荐方案论文插图+ Illustrator 微调字体/间距文档嵌入(GitHub/GitLab 原生支持)大规模图精确控制布局rank=same+ 虚拟节点中文环境全局fontname+ 系统安装中文字体版本控制保存.gv源文件(文本),而非仅图片自动化流水线将.gv文件纳入 CI/CD,自动生成最新流程图💡终极建议永远保存 DOT 源文件.gv)—— 文本可 diff/merge,图片不可复杂图先手绘草图—— 明确层级/分组后再写 DOT样式全局定义—— 避免每个节点重复设置fillcolor。
2026-02-07 10:29:08
471
原创 Matplot++ 数据可视化工具介绍与使用指南
Matplot++是由 Alan de Freitas 开发的纯 C++ 实现的数据可视化图形库,旨在为 C++ 开发者提供类似 MATLAB/matplotlib 的绘图体验,同时保持 C++ 的原生性能优势 [[4]]。l->line_width(2.5) // 线宽 2.5pt->color({0.2, 0.4, 0.8}) // RGB 颜色 (0~1)->marker("*") // 标记符号: *, o, s, ^...
2026-02-06 08:54:59
462
原创 Asymptote(高性能矢量绘图语言)
场景推荐度理由3D 数据结构可视化⭐⭐⭐⭐⭐真 3D 渲染,TikZ 无法替代算法动画演示⭐⭐⭐⭐animate库生成分步动画高性能科学绘图⭐⭐⭐⭐⭐10 万级对象秒级渲染2D 简单框图⭐⭐代码冗长,Draw.io 更高效学术论文插图⭐⭐⭐⭐与 LaTeX 无缝集成,出版级质量PPT 快速制图⭐⭐学习成本高,适合长期投入者✅终极建议日常教学:80% 用 Draw.io(快速),20% 复杂图用 TikZ/Asymptote科研出版:3D 图必用 Asymptote,2D 图用 TikZ。
2026-02-05 18:17:35
540
原创 bash: rsync命令的系统性深度解析
原则说明安全第一永远先-n预览,再备份,最后执行校验和优先用-c避免时间戳误判(尤其跨文件系统)增量是核心利用实现高效快照备份网络适配局域网用,广域网用-z排除规则外置用管理复杂过滤日志必开--log-file记录每次同步详情,便于审计✅黄金命令模板# 安全同步(生产环境推荐)rsync 是经过 25+ 年生产验证的数据同步基石工具,掌握其核心原理与高级技巧,可构建高效、可靠、安全的备份与同步系统。
2026-02-05 16:27:50
708
原创 Perl语言核心概念解释与学习
Perl(Practical Extraction and Report Language)是一门以文本处理见长的动态脚本语言,其设计哲学是"不止一种方法去做一件事"(TMTOWTDI)。以下是 Perl 5 的核心概念详解,包含实用代码示例:Perl 有三种基本数据类型,通过前缀符号区分:存储单一值:数字、字符串、引用2. 数组(Array)有序标量集合,索引从 0 开始3. 哈希(Hash)无序键值对集合(关联数组)二、函数(子程序)Perl 使用 定义子程序,参数通过 传递:三、模块
2026-02-05 07:37:48
716
原创 MeshGraphNet和GNS(Graph Network-based Simulators)
AI在仿真领域的应用:MesGraphNet&GNS
2026-02-04 11:15:33
1060
原创 NVIDIA 物理机器学习(Physics-ML)框架PhysicsNeMo介绍
MeshGraphNets 是 DeepMind 2020 年的研究工作,而 PhysicsNeMo 是 NVIDIA 基于其前身 Modulus/SimNet 发展的独立框架 [[32]]。容器内已预装 DGL(图神经网络库)、nvFuser(GPU优化)等依赖 [[75]]包含CFD、热传导、结构力学等完整案例 [[48]](相比传统CFD加速100-1000倍)[[79]],用于瞬态物理问题(如涡脱落)[[45]](如自动缝合、拓扑识别)。替代旧命令 [[69]]PDE/几何/边界条件。
2026-02-04 00:43:57
1351
原创 OpenFOAM: NCC (Non-Conformal Coupling)最新耦合边界条件方法解释(AI对话)
NCC 被设计为一种比传统 AMI 更健壮且严格保守(Conservative)的替代方案。严格守恒性: 与基于插值的 AMI 不同,NCC 旨在提供更好的质量保证和守恒性,特别适用于旋转机械(如叶轮、涡轮)和滑动网格案例。动态耦合: 在仿真运行期间,NCC 会动态计算交界面的重叠区域。它在 constant/polyMesh/boundary 中创建初始面数为零的 nonConformalCyclic 补丁,然后在计算时通过 fvMeshStitcher 填充面信息。
2026-02-03 16:39:43
1100
空空如也
点击博客链接,404报错
2025-06-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1