deepin 15.10 无法转换到 prime模式的一点想法

其实没什么想法,就是换个版本就可以了,我是换了15.8的版本,马上就可以装了

2019-07-04 16:53:37

阅读数 58

评论数 0

tensorflow '/path/to/model/model.ckpt' Windows下面 在哪里

如果你在Windows下面跑tensorflow,如下代码时候 with tf.Session() as sess: sess.run(init_op) saver.save(sess,'/path/to/model/model.ckpt') 他会在将/转化为c://pa...

2019-07-03 15:50:33

阅读数 11

评论数 0

error LNK2019: 无法解析的外部符号 curandCreateGenerator,该符号在函数 main 中被引 用

少年哟,有没有遇到过下面的问题哟 行了,斜眼笑,就是使用CUDA的时候,如果用了#include <curand_kernel.h> 如果简单地使用nvcc .\TSP.cu -o TSP,是不可以编译通过的,不过简单加上-lcurand,就可以了 就可以了,...

2019-06-12 19:52:58

阅读数 41

评论数 0

CUDA-多核第一次作业-计算高斯函数

话不多说,直接上代码,其实也是比较容易的 只能在Linux下面跑,考虑到有windows的小伙伴,其实把与时间有关的内容删除就可以了,写在更下面的了。 #include<math.h> #include<time.h> #includ...

2019-05-28 22:17:57

阅读数 21

评论数 0

内存模型对应的-关键字

一,内存的概括 全局内存- __device__ 常量内存- __constant__ 拷贝到GPU的函数 cudaError_t cudaMemcpyToSymbol(const void *symbol, const void * src, size_t count); cudaE...

2019-04-20 19:52:26

阅读数 22

评论数 0

线程束洗牌指令

对一个给定线程计算其线程束-束内索引和线程束索引的公式如下 laneID = threadIdx.x % 32 warpID = threadIdx.x / 32 有两组洗牌指令,分为整数型和浮点型,每组有4种形式的洗牌指令 1. int __shf1(int var, int sr...

2019-04-20 17:17:00

阅读数 26

评论数 0

又开新坑了-全局内存

首先, 把一个线程块最里面一层的维度设为线程束大小的一半,这导致内存负 载效率的大幅下降。这种性能损失不能用线程束调度或并行性来解释,造成这种性能损失 的真正原因是较差的全局内存访问模式。 ...

2019-04-20 10:54:41

阅读数 16

评论数 0

动态并行

我也没啥好说的,先占了坑,讲讲下面要学习动态并行-嵌套并行了而已 注意:如果调用的线程没有显示同步启动子网格,那么运行时保证,父网格和子网格隐式同步。 首先写第一点,编译的命令行需要添加 -arch=sm_35 -rdc=true -lcudadevrt 举个例子 nvcc...

2019-04-19 23:29:21

阅读数 41

评论数 0

CUDA 优化的方法-规约,循环展开,模板

大概就是,我们可以通过一些方法对相加等满足交换律和结合律的运算做加速程序执行,在CUDA里面有 1.规约,包括 -------->相邻配对 和 交叉配对 两种方法 2.循环展开 --------->2,4,8展开,甚至全部展开 3.模板 ----------...

2019-04-19 23:02:09

阅读数 39

评论数 0

-计算非终结符的FIRST集合-First集合-可以过和不能过的代码

1000. 计算非终结符的FIRST集合 Total: 665 Accepted: 0 Time Limit: 1sec Memory Li...

2019-04-19 11:46:15

阅读数 97

评论数 0

win10 前面板 耳机

搞定,非常玄奇

2019-04-17 20:48:32

阅读数 26

评论数 0

一个计算毫秒的小工具

inline double seconds() { LARGE_INTEGER cpuFreq; LARGE_INTEGER startTime; double runTime=0.0; QueryPerformanceFrequency(&cpuF...

2019-04-17 17:26:26

阅读数 93

评论数 0

一个可能的visual studio 的 cl.exe可能的地址

默认地址是 C:\Program Files (x86)\Microsoft Visual Studio\2019\Community\VC\Tools\MSVC\14.20.27508\bin\Hostx64\x64

2019-04-08 19:49:27

阅读数 142

评论数 0

关于CUDA-纹理内存的使用

简要介绍一下 还是直接上代码:---有个要点注意一下,由于init_data操作的是设备内存,所以必须在设备代码中操作,为了简单起见所以直接使用了<<<1,1>>>直接初始化,还是停留在串行的程序设计中。然后...

2019-04-04 10:53:48

阅读数 97

评论数 0

关于 循环展开

可以尝试在循环前面加上 #pragma unroll 的作用是提示CUDA编译器,表明这个循环将被自动展开。

2019-04-03 23:09:44

阅读数 51

评论数 0

关于CUDA的二维数组

直接上代码,最奇怪的几点就是貌似 1.对设备内存的操作-指定二维指针指向的一维指针,需要在设备函数中做,在主机中做会爆炸-- 2.貌似设备的形参就是传递了引用。,而不需要加&了,非常奇怪,加了&反而会错误。但是在主机代码中,是需要加& 的。我只能...

2019-04-03 20:11:17

阅读数 64

评论数 0

关于CUDA-共享内存

共享内存只能在一个块里面的线程共享,不同块之间是不能共享shared memory的 简单声明一个共享内存的关键词就是__shared__ 声明数组如 __shared__ int arr[10][20]; 动态声明数组,如 exten __shared__ int arr[]; ...

2019-04-03 17:04:56

阅读数 32

评论数 0

CUDA--只读缓存

使用CUDA只读缓存有两个办法 1.你可以使用内部函数__ldg来通过只读缓存直接对数组进行读取访问: 但是我的汇报错,说__ldg未定义,非常玄奇,不知道有没有老铁看了知道的告诉我一下 __global__ void copyKernel(int *out,int *in){ ...

2019-04-03 16:06:20

阅读数 65

评论数 0

关于-CUDA统一虚拟编址-

总的来说,就是 cudaHostAlloc((void **)&h_A,nBytes,cudaHostAllocMapped); 获取的h_A也是可以当作设备指针用的,不再需要 cudaHostGetDevicePointer((void **)&d_A,...

2019-04-03 10:32:48

阅读数 49

评论数 0

CUDA 零拷贝内存

一个简单的测试程序: #include <cuda_runtime.h> #include <stdio.h> __global__ void sumArraysZeroCopy(float *A, float *B, float *C...

2019-04-03 01:12:42

阅读数 26

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭