TensorRT及CUDA自学笔记003 NVCC及其命令行参数

TensorRT及CUDA自学笔记003 NVCC及其命令行参数

各位大佬,这是我的自学笔记,如有错误请指正,也欢迎在评论区学习交流,谢谢!

NVCC是一种编译器,基于一些命令行参数可以将使用PTX或C语言编写的代码编译成可执行文件。

NVCC工作流程

在这里插入图片描述

  1. NVCC分离源文件中与GPU相关的内核代码,将其编译为cubin或PTX中间文件,并保存在fatbinary中。如果源文件使用C语言编写就编译为cubin,如果源文件使用PTX语言编写就将其编译为PTX中间文件。
  2. NVCC分离源文件中与主机相关的代码,使用当前系统中的编译器(如g++)进行编译,并将fatbinary嵌入其中。
  3. 进行链接,链接CUDA运行库和用户使用的库,最后产生可执行文件。

NVCC输入文件解释

在这里插入图片描述

NVCC命令行

在这里插入图片描述
详见链接

常用的NVCC命令行参数

短名参数长名参数含义
-i–include-path用来设置头文件路径
-o–output-file指定输出文件
-l–library指定库路径
-g–debug指定debug模式
-arch–gpu-architecture指定虚拟机架构,配置PTX兼容性
-ptx设置输出ptx文件路径
-code–gpu-code设置二进制兼容性
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值