cuda
JsonZhang_ZY
听着,路飞,胜利与失败都要品尝,经历了四处逃窜的辛酸,痛苦伤心的回忆,才能真正成为独当一面的男子汉,就算痛哭流涕也没关系,一定要闯过这一关!
展开
-
CUDA进阶第二篇:巧用PTX
写在前面并行线程执行(Parallel Thread eXecution,PTX)代码是编译后的GPU代码的一种中间形式,它可以再次编译为原生的GPU微码。CUDA 手册传送门:Parallel Thread Execution ISA Version 4.3利用PTX来进行试验,我们可以解决一些在写代码时遇到的不确定问题。下面举几个例子:核函数的参数是直接放到寄存器中转载 2017-10-26 18:56:15 · 1273 阅读 · 0 评论 -
CUDA4.0 inline PTX汇编程序开发
内联PTX汇编具有如下形式:asm(“instop”:”type_symbolic”(or):”type_symbolic”(ir),..);asm(“instop”::”type_symbolic”(r));第二种形式是无输出操作格式,需要使用”::”指示符其中instop是指令操作type_symbolic是类型指示符(可选如下),分别对应与PTX中的数据类型:“h”转载 2017-10-26 18:52:02 · 1699 阅读 · 0 评论 -
./include/caffe/common.hpp:4:32: fatal error: boost/shared_ptr.hpp: 没有那个文件或目录
第n+1次安装caffe。环境:ubuntu16.04+cpuonly+anaconda2解决方案:出现该错误的原因是少了依赖。在命令行输入:[plain] view plain copy$ sudo apt-get install --no-install-recommends libboost-all-dev转载 2017-10-26 18:57:43 · 4153 阅读 · 1 评论 -
Linux下实时查看GPU状态
1. 显示当前GPU使用情况Nvidia自带了一个nvidia-smi的命令行工具,会显示显存使用情况:$ nvidia-smi11输出: 2. 周期性输出GPU使用情况但是有时我们希望不仅知道那一固定时刻的GPU使用情况,我们希望一直掌握其动向,此时我们就希望周期性地输出,比如每 10s 就更新显示。 这时候就需要用到 watch命令,来周期性地执行nvi转载 2017-10-26 18:58:54 · 58766 阅读 · 1 评论