ZhiqianXia-CSDN博客

原创 MxNxK状态问题如何降低状态空间

MxNxK问题的复杂性往往源于维度间的交互。

2025-12-12 10:22:24 237

原创 TableGen 常用 DAG Operator 完全指南

【代码】TableGen 常用 DAG Operator 完全指南。

2025-12-12 00:10:55 342

原创 TableGen 编程规范与最佳实践

TableGen代码是LLVM后端的基石。

2025-12-11 23:57:56 392

该文档是Nicolai Hähnle在FOSDEM 2019上关于LLVM TableGen的分享内容，核心介绍了TableGen作为LLVM中的工具与语言，其工具端包含和（共享前端、不同后端），可生成MCInstrDesc、指令选择等目标文件，语言端是记录定义的超集，支持类、多类等特性；还详细阐述了TableGen的类型系统（如bit、dag等）、核心语言特性（类、let语句、多类、foreach、defset、内置函数），并以AMDGPU图像内置函数与指令。

2025-11-20 10:36:01 563

原创 LLVM 指令选择笔记

2025-11-19 10:06:33 596

原创 NCCL学习笔记

NCCL（NVIDIA Collective Communication Library）是 GPU 集群高性能集体通信的核心软件层，专注于优化 GPU-to-GPU 交互支持 NVLink、PCIe、InfiniBand 等 interconnect 技术，广泛应用于分布式 AI 与 HPC workloads.NCCL起初的设计目标是构建一款易集成、拓扑感知的集体通信库，最终提升多 GPU 应用的可扩展性，并行应用可扩展性中，通信相关的核心限制因素是通信量和通信与计算的重叠程度.

2025-11-12 00:32:55 601

原创 Bourbaki的故事

布尔巴基是一个数学家集体，他们的核心思想是使用极端严谨的公理化方法和“数学结构”的观念，来统一和重构整个现代数学的基础。

2025-11-03 20:27:30 918

原创 Zermelo–Fraenkel 公理集合论（ZF）

标准的ZF系统包含以下8条公理（有时会将“空集公理”和“无穷公理”单独列出）。外延公理两个集合相等，当且仅当它们拥有相同的元素。定义了集合的“身份”——集合由其元素唯一决定。空集公理存在一个不包含任何元素的集合，称为空集（∅）。为整个集合宇宙提供了一个起点。配对公理对任意两个集合 (a) 和 (b)，存在一个集合 ({a, b})，其元素恰好是 (a) 和 (b)。允许我们构造简单的有限集合。并集公理。

2025-11-03 19:44:36 1000

原创初等数论基础知识

一个基础：整数的整除性。一个核心素数的分布与性质。一个核心工具同余理论。一类核心问题：求解不定方程的整数解。几个关键定理算术基本定理欧拉定理/费马小定理中国剩余定理。

2025-11-03 19:12:34 878

原创 # 数学符号参考手册大全

【代码】# 数学符号参考手册大全。

2025-11-03 19:07:34 1055

原创代数常见结构

这类结构有两个运算，通常一个类似“加法”，一个类似“乘法”。这些是最简单的代数结构，通常要求运算满足某些公理。这类结构源于序理论，但在抽象代数中也占有重要地位。这类结构可以看作是“向量空间”概念的推广。

2025-11-03 18:38:39 856

原创有趣的100个数学思想

2025-11-03 18:13:45 957

原创 Blackwell GPU提供LLVM和MLIR支持的相关工作报告

在2025年4月于柏林举办的EuroLLVM会议上，Durgadoss Ramanathan等人介绍了为NVIDIA Blackwell GPU提供LLVM和MLIR支持的相关工作，包括Blackwell GPU的核心特性（如MMA从Hopper的Warp Group演进为CTA对、新增TMEM及专用指令、TMA新模式等）、编译器 lowering 流程（MLIR→LLVM→PTX）中针对Blackwell的扩展（新增约30个MLIR操作、1000个NVVM内在函数及TMEM的6号地址空间）、

2025-10-30 17:16:55 715

原创 LLVM libc 进展技术报告

在2024年LLVM开发者会议上，Google的Tue Ly介绍了LLVM libc（LLVM旗下从零构建的C标准库，支持C23、POSIX标准，适配多OS、多CPU、嵌入式系统及GPU，基于C++和部分内联汇编开发，目标是实现完整C23标准并打造跨平台统一libc）及其math库（libm）的当前状态与未来方向；libm以。

2025-10-30 15:29:33 639

原创指针认证ABI（基于ELF平台）相关内容总结

基于ELF平台的指针认证ABI（PAuth ABI）PACxx核心问题：代码指针在生命周期中（从只读内存加载到寄存器、暂存到读写内存再重新加载）易遭受替换攻击——攻击者通过内存写入篡改指针，导致调用/跳转到恶意代码。解决方案指针认证（Pointer Authentication），通过特定指令为指针添加签名（PAC），在使用前验证签名，确保指针未被篡改。依赖ISA：基于ARM架构，具体为Armv8.3：引入签名指针功能，是指针认证的基础；：进行额外改进；共涉及48条指令。

2025-10-30 15:15:23 998

原创 RSICV 函数调用ABI实现报告总结

该文档以RISC-V向量扩展为例，详细介绍了在LLVM中添加新调用约定的方法，首先回顾调用约定的核心作用（统一函数调用者与被调用者的参数寄存器、返回值寄存器使用规则及寄存器状态维护责任），接着阐述RISC-V标量与向量寄存器的ABI规范、栈布局（含标量/向量局部变量、变长对象等在栈中的位置），最后重点说明实现细节（包括在Clang侧添加函数属性、处理向量类型参数的约束与LLVM类型建模、调用者/被调用者保存寄存器的配置与代码实现，以及寄存器不足时参数通过栈传递的机制）。统一参数寄存器使用。

2025-10-30 15:01:36 890

原创 SPIR-V后端稳定性的推进工作报告总结

在2024年LLVM开发者会议上，Vyacheslav Levytskyy和Michal Paszkowski介绍了SPIR-V后端稳定性的推进工作，当前SPIR-V后端已实现显著提升，包括支持约500个LIT测试用例、达到OpenCL 3.0兼容性SYCL兼容性达93%-99%（依优化级别而定），还完成26个SPIR-V扩展的实现并提升了与Khronos LLVM/SPIR-V Translator的兼容性；

2025-10-29 17:28:22 797

原创 gcc/llvm 编译器发布的实践洞察报告

该文档围绕GCC与LLVM的发布工程策略展开，介绍了二者的历史演进、开发与发布模型，通过对比分析指出GCC的核心优势是稳定性、长期支持（3年维护期）及能可靠编译整个Linux发行版，但存在创新较慢、开发流程僵化的问题；LLVM则具备灵活性、快速创新和模块化设计的优势，不过面临缺乏长期支持（LTS）、ABI/API稳定性不足的挑战，同时探讨了LLVM作为Linux替代系统编译器的障碍及潜在的混合LTS模型，最后提出相关关键问题供进一步讨论。

2025-10-29 17:10:02 609

原创 Mojo Optimization Pipeline 构建经验报告总结

该文档推测为2024年10月LLVM开发者大会（LLVM DevMtG 2024-10）技术演讲（TechTalk）的幻灯片，演讲者可能为Weiwei，核心内容围绕构建Mojo编程语言优化管道（Mojo Optimization Pipeline）的实践经验展开，预计会分享在优化管道开发过程中遇到的关键挑战、采用的技术方案、实现的优化效果（如性能提升、编译效率改善等）以及从中提炼的核心经验，为相关编程语言优化或编译器开发领域提供参考。关联会议。

2025-10-29 17:05:48 975

原创 github 软件安全术语

方便你在查阅文档或实际应用时快速参考？要不要我帮你整理一份。

2025-10-29 16:38:57 993

原创如何成为Review 邮件的“快读高手”

步骤关注点目标预计耗时1. 扫标题组件、版本、发件人快速筛选，判断相关性10秒2. 读描述“为什么”要改、如何测试理解意图和背景1分钟3. 审代码文件路径、核心逻辑、代码“坏味道”评估技术方案和质量1-3分钟4. 看讨论维护者意见、讨论状态、遗留问题了解社区共识和下一步30秒-不定最后，熟能生巧。刚开始可能会慢一些，但随着你对项目代码和常见模式的熟悉，你的阅读速度会飞速提升。这项技能不仅能让你更好地参与社区，也是向顶尖开发者学习的绝佳途径。

2025-10-29 09:55:47 268

原创技术Leader的典型画像

一个理想的技术Leader，是“首席技术决策者”“团队教练”和“战略合伙人”三者的完美结合。在代码评审和架构设计中，他是严谨的架构师。在项目攻坚时，他是冲在一线的将军。在团队迷茫时，他是举着火把的引路人。在与外部协作时，他是团队价值和利益的守护者。在规划未来时，他是连接技术与商业的桥梁。最后，也是最重要的一点：他是一位“造钟师，而不是报时员”。他的终极成功，不是解决了多少个紧急故障，而是打造了一个能够自我进化、高效运转、人才辈出的技术团队和组织体系。

2025-10-28 14:02:02 481

原创切换C++编译器报告总结

该文档围绕“切换C++编译器”展开，阐述了切换的四大核心原因（获取新C++标准支持、适配新目标平台、使用其他工具链/IDE特性、解决旧编译器漏洞），指出切换并非简单操作，需经历基础设施搭建（开发与CI环境配置，含工具链安装、版本冲突处理）、依赖管理（第三方库兼容验证、替换与封装）、项目编译（处理编译器特定扩展、过时特性、行为差异与警告）、运行测试（应对未定义行为与实现定义行为问题）四大关键步骤，同时提供了“先调研、制定计划”等避坑策略，强调切换需并行使用新旧编译器、重视文档与版本控制。获取新C++标准支持。

2025-10-27 17:35:47 707

LLVM MachineScheduler UML 图

空空如也