Yan_Joy的博客

真正博客: http://yanjoy.win/

Tensorflow 解决 No module named '_pywrap_tensorflow_internal'

这个问题是我在windows上尝试安装GPU版本时出现的,系统 win10,CUDA 8.0,VS2015 com,cudnn-8.0-windows10-x64-v6.0。 官网上安装指南中Common installation problems也有提到,给出的是STACK OVERFLOW ...

2017-07-25 18:55:48

阅读数:12233

评论数:0

cuda 学习 | GPU的归约、扫描、直方图算法

两种复杂度 Step complexity 即步骤复杂度,完成一个工作需要多少步。 Work complexity 即工作复杂度,完成工作一共需要的工作量。 对于并行计算,由于可以采取多线程的运算,可以对每一步的运算时间进行很大的缩减。但对于整个程序,有时需要分很多步骤,后续步骤需要等待前面的...

2017-04-05 11:20:12

阅读数:1071

评论数:1

cuda 学习 | GPU硬件与并行通信模式

通信方式通信方式主要以课程截图为主……Map 这是一种一一对应的方式。Gather 多对一的方式。Scatter 一对多的方式。Stencil 模板,多对多的方式。 图中左中为输入,左下为输出,不同颜色为不同线程的读取、输出位置。Transpose 转置操作,改变形状、顺序等。 ...

2017-03-31 16:32:44

阅读数:1034

评论数:0

cuda 并行计算 | GPU 编程模型

udacity上的课程,有nvidia的工程师上课,比较基础也比较易懂。CUDA程序的特点相比于CPU的单线程串行计算,CUDA程序的多线程对速度提升有很大的作用。 这就是优化时间与优化吞吐量的区别。 程序编译后分别在CPU和GPU上运行; CPU是主机(host),GPU是从机(device)...

2017-03-30 13:13:45

阅读数:1591

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭