![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
编译器
文章平均质量分 68
Ahuier21
恩,技术小白,大家多指教,鞠躬~
展开
-
nvprof工具使用及结果分析,持续更新。。。
会使用总结后更新,大家可以留言介绍nvprof是用来测试了解并优化CUDA或OpenACC应用程序的性能的分析工具。分析工具使您能够从命令行收集和查看分析数据。基本使用nvprof ./a.out a.out为编译后的可执行文件结果如下: 结果分析Profiling result:是GPU上的时间API calls:是在cpu上测量的时间–m...原创 2018-06-02 21:21:29 · 22127 阅读 · 3 评论 -
Linux下安装TVM
TVM安装前言安装要求:gcc版本 >=4.8CMake >=3.5python3 最新的tvm已经不支持python2了llvm 我选择的版本为llvm-4.0.0从github上下载TVM下载源码->创建要编译生成so的文件夹-> $ git clone --recursive https://github.com/dmlc/tvm $...原创 2019-05-29 16:22:10 · 4122 阅读 · 2 评论 -
使用pdb与gdb调试TVM源码
使用pdb与gdb调试TVM源码前言TVM代码库的一个有趣的方面是c++和Python之间的互操作性不是单向的(python和C++的交互)。通常,所有执行重载的代码都是用c++实现的,并且为用户界面提供了Python绑定。在TVM中也是如此,但是在TVM代码库中,c++代码也调用Python模块中定义的函数。例如,用Python实现卷积运算符,它的实现是从Relay中的c++代码调用的。所以...原创 2019-05-29 17:16:11 · 2566 阅读 · 2 评论 -
TVM代码库结构概述
前言在看一个开源的项目,之前必须要先了解其代码库的组织结构以及每部分的功能作用。tvm根目录首先在TVM的的根目录下,有以下几个子目录,它们一起构成了大量的代码库。Src:C++ code for operator compilation and deployment runtimes.用于运算符编译和部署运行时的C++代码。src/relay:Implementation ...原创 2019-06-18 16:31:57 · 4252 阅读 · 0 评论