- 博客(13)
- 资源 (12)
- 收藏
- 关注
原创 gpu_burn在使用cuda13中遇到的编译问题
摘要:使用gpu_burn工具进行GPU加压测试时,在CUDA 13环境下编译出现错误。主要问题是cuCtxCreate函数在新版本中需要4个参数,而代码中只传入了3个参数。解决方法是将创建上下文的方式改为cuDevicePrimaryCtxRetain函数调用。此外还需修改Makefile中的架构配置(如将compute_50改为compute_120)以适应新显卡架构。修改完成后可成功编译并运行测试工具。该问题反映了CUDA API版本升级导致的兼容性问题,通过调整代码和配置即可解决。
2025-09-18 20:52:50
949
2
原创 NVIDIA开源内核驱动代码学习-src下的两个Makefile解析(八)
摘要:本文分析了NVIDIA开源内核驱动中src目录下的两个关键Makefile文件。src/nvidia/Makefile负责构建核心组件nv-kernel.o,包含安全特性配置、死代码消除等高级功能,并与kernel-open/Makefile形成构建流程衔接。src/nvidia-modeset/Makefile则专注于显示模式设置模块nv-modeset-kernel.o的构建,特别处理了多GPU架构的着色器文件。这两个Makefile与kernel-open中的构建文件共同组成层次化构建系统
2025-09-17 11:18:12
921
原创 NVIDIA开源内核驱动代码学习-kernel-open下的Makefile和Kbuild文件详解(七)
本文解析了NVIDIA Linux GPU驱动内核模块构建系统中的Makefile和Kbuild文件。Makefile负责设置构建环境,包括内核源码路径检测、编译器设置、架构检测和模块管理,支持x86、arm64等架构,并处理模块链接脚本和BTF生成。Kbuild文件则通过预定义变量和动态包含模块构建规则实现模块化编译,采用conftest机制检测内核特性以进行条件编译。两者协同工作,使驱动能适配不同内核版本和硬件架构,支持特殊平台需求,确保驱动在各种Linux环境下的正确构建和运行。
2025-09-17 10:49:45
796
原创 NVIDIA开源内核驱动代码学习-kernel-open下的Makefile等文件(六)
本文解析了NVIDIA OpenGPU Kernel Modules项目中kernel-open目录下关键文件的作用。Kbuild作为核心配置文件定义模块编译规则;Makefile协调整个构建流程;dkms.conf管理模块的自动安装;header-presence-tests.mk检测系统头文件;count-lines.mk统计项目规模;conftest.sh检测系统环境并生成配置文件。这些文件协同工作,完成环境检测、模块构建、安装管理和项目分析等功能,确保内核模块的正确编译和安装。
2025-09-17 10:06:25
852
原创 NVIDIA开源内核驱动代码学习-makefile解析(五)
本文分析了NVIDIA Linux内核驱动模块的构建系统,主要包含Makefile和utils.mk两个核心文件。Makefile负责驱动模块的编译安装流程,通过分层构建和符号链接机制,将基础驱动(nvidia.ko)和显示模块(nvidia-modeset.ko)整合到内核构建系统(kbuild)中。utils.mk提供了通用的构建框架,包含编译器设置、多平台支持、调试信息处理、版本生成等功能模块,采用函数式定义实现灵活的构建规则。两个文件协同工作,通过模块化设计和标准化构建流程,确保驱动能在不同Linu
2025-09-17 09:28:51
878
原创 NVIDIA开源内核驱动代码学习-总体代码结构(四)
摘要:本文分析了NVIDIA开源的Linux GPU内核驱动项目(版本580.82.07),重点解析了其模块化架构。项目包含6个核心模块:主驱动模块(nvidia.ko)处理设备初始化/内存管理,显示模块(nvidia-modeset.ko)负责显示输出,统一内存模块(nvidia-uvm.ko)实现CPU-GPU内存协同,DRM接口模块(nvidia-drm.ko)提供图形框架集成,对等内存模块(nvidia-peermem.ko)支持多GPU通信,以及Nouveau固件工具。代码采用分层设计,分离操作系
2025-09-11 09:12:55
1177
原创 NVIDIA开源内核驱动代码学习-Kernel-open目录结构解析(三)
NVIDIA开源的GPU内核模块kernel-open目录包含五个核心子模块:nvidia(基础GPU驱动)、nvidia-modeset(显示模式设置)、nvidia-drm(图形系统集成)、nvidia-uvm(虚拟内存管理)和nvidia-peermem(设备间直接内存访问)。这些模块采用分层设计,相互协作为Linux系统提供完整的GPU支持,其中nvidia-peermem模块特别优化了高性能计算场景下的数据传输效率。该模块化架构提升了驱动的可维护性和扩展性,满足不同应用场景需求。
2025-09-07 21:09:53
921
原创 NVIDIA开源内核驱动代码学习-README和安装说明(二)
NVIDIA开源了580.82.07版本的Linux GPU内核模块,支持图灵及更新架构的GPU。文档详细介绍了构建方法(需配合GSP固件和用户空间驱动)、系统要求(Linux 4.15+内核、x86_64/aarch64架构)和目录结构。内核模块分为OS无关组件和需针对内核编译的接口层。注意事项包括驱动版本匹配、GPU功能限制等。该项目为Linux用户和开发者提供了更好的GPU驱动支持。
2025-09-07 20:52:49
443
原创 NVIDIA开源内核驱动代码学习-目录结构(一)
本文分析了NVIDIA开源GPU内核模块项目的目录结构,重点介绍了kernel-open和src目录的关系。项目包含内核接口层(kernel-open)和核心功能层(src),其中kernel-open目录提供与Linux内核交互的接口代码,如nvidia、nvidia-drm、nvidia-modeset等模块;src目录则包含跨平台的GPU核心功能实现。文章详细解析了各子目录的功能及对应关系,并建议初学者从整体结构到核心概念逐步深入学习。
2025-09-07 11:32:16
1470
原创 Ceph官网笔记1--简介
“Ceph中文文档”外衣的文章或者PDF文档,都是2016年的版本,现在已经完全不适用了。捋着最新的英文官方文档,做个笔记。并非严谨的翻译。
2023-04-03 15:38:47
577
1
2015-2025年常见GPU参数一览表
2025-08-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅