![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
curry dog
自然语言处理
展开
-
error: ‘AT_CHECK’ was not declared in this scope
error: ‘AT_CHECK’ was not declared in this scope解决方法hailanyi 2021-05-21 17:32:36 1758 收藏 12分类专栏: pytorch 文章标签: pytorch 神经网络版权pytorch专栏收录该内容2 篇文章 0 订阅订阅专栏error: ‘AT_CHECK’ was not declared in this scope在编译deform_conv时遇到问题:error: ‘AT_CHECK’ was not转载 2021-12-30 15:05:27 · 899 阅读 · 0 评论 -
cuda 操作杂记
curandcurandState_t 用来控制产生不同的随机数,用seed来初始化curand_init(seed, index, 0, &states[index]);device float curand_uniform (curandState_t *state) 输出一个0到1的均匀分布,device float curand_normal (curandState_t *state) 输出一个0到1的正太分布,thrustthrust :: host_vector <i原创 2020-10-28 14:48:58 · 277 阅读 · 0 评论 -
ubuntu nsight使用
运行nsight compute/usr/local/cuda/nsight-compute-2019.5.0$ sudo ./nv-nsight-cuquick start图中以文件的形式保存profile, 并且选择memory workload 这一个section 作为指标原创 2020-09-23 01:07:22 · 1625 阅读 · 0 评论 -
cuda学习
一个线程束由32个连续的线程组成,在一个线程束中,所有的线程按照单指令多线程(SIMT)方式执行;即,所有线程都执行相同的指令,每个线程在私有数据上进行操作。从逻辑角度来看,线程块是线程的集合,它们可以被组织为一维、二维或三维布局。从硬件角度来看,线程块是一维线程束的集合。在线程块中线程被组织成一维布局,每32个连续线程组成一个线程束。...原创 2020-09-22 20:15:08 · 331 阅读 · 1 评论 -
linux cuda cmakelists写法
写法一:需要配置环境变量CUDAXXcmake_minimum_required(VERSION 2.8 FATAL_ERROR)Project(CUDA_Freshman)enable_language(CUDA)add_executable(hello_world hello_world.cu)写法二:# CMakeLists.txt to build hellocuda.cucmake_minimum_required(VERSION 2.8)find_package(CUDA Q原创 2020-09-14 22:54:07 · 589 阅读 · 0 评论