- 博客(4)
- 收藏
- 关注
转载 Turbo Cache技术
Turbo Cache,即Turbo Cache技术,是NVIDIA推出的一项技术。通俗的说,Turbo Cache技术就是用内存当显存来使用。既然是利用系统内存,这和以前的集成显卡又有什么区别呢?在nVIDIA 的官方技术说明中,内存管理技术可以“允许GPU在分配和不分配系统内存时无缝切换,并且高效的读写内存”。这个工作由驱动程序中名叫TC的管理部分执行,以分配和平衡系统及本
2016-07-28 21:40:23 1128
原创 多线程程序在多核和单核上运行的不同
1、锁在单核上,多个线程执行锁或者临界区时,实际上只有一个线程在执行临界区代码,而核心也只支持一个线程执行,因此不存在冲突。如果某个线程持有锁,那只有其他线程不会被调度到CPU上执行,影响的只是持有和释放锁的时间,处理器时刻在运行着。但是在多核上运行时,锁或临界区会导致其余处理器空闲而只允许一个处理器执行持有锁的那个线程,这是一个串行的过程,会影响性能。2、负载均衡单核上不用考虑负载均
2016-07-26 16:38:43 6999
原创 cuda debug 查看显存中变量
用工程自带的简单数组加法测试。一、打开start CUDA debug二、打开CUDA warp watch 及CUDA info三、就可以查看kernel中(显存)的变量了
2016-07-12 20:17:02 4887 1
转载 cuda内存处理及stream内存处理
CUDA内存拷贝1、cudaMemcpy() cudaMalloc() //线性内存拷贝1 //线性内存拷贝2 cudaMalloc((void**)&dev_A, data_size);3 cudaMemcpy(dev_A, host_A, data_size, cudaMemcpyHostToDevice);2、cudaMemcpy2D()cudaMallocPi
2016-07-09 13:31:16 1438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人