- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 最简单的CUDA程序
#include <stdio.h>__global__ void helloFromGPU(void){if (threadIdx.x == 5){printf("Hello World from GPU thread %d!\n", threadIdx.x);}}int main(void){printf("Hello World from CPU!\n");helloFr
2017-02-27 20:10:11 1260
原创 Runtime API使用范例
1.资料:2.使用:cudaStream_t stream[2]; for(int i=0;i<2;i++) cudaStreamCreate(&stream[i]);参考资料:CUDA_Runtime_API.pdf
2017-02-27 11:03:26 834
原创 共享存储器bank conflict
对每个bank在每个周期只能进行一次32位的读写操作,因此也说每个bank的带宽为每周期32bit。 只要同一个 warp 的不同线程会访问到同一个 bank 的不同地址就会发生 bank conflict,除此之外的都不会发生 bank conflict。
2017-02-27 10:18:50 1240
原创 基本数据类型的字节大小
一、程序#include<iostream>using namespace std;int main(){cout<<sizeof(char);}二、结果 int:4字节(32位)
2017-02-23 21:11:10 721
原创 CUDA学习记录之-吉祥的博客
CUDA简介 CUDA和C对内存操作函数的对比表 GPU架构 软硬件构架图 GPU架构(Fermi、Kepler) 1.CUDA核的数量(包括ALU和FPU)=SM的数量×每个SM里面CUDA核的数量,例如:512个accelerator cores即所谓CUDA cores(包含ALU和FPU)16个SM,每个SM包含32个CUDA core。 2.每个SM由一下几部分组成:
2017-02-16 18:42:25 833
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人