共享内存一般用来存储临时数据 ,最初输入和最终输出都是全局内存。每个块一个共享内存,每个块一个结果。高速
cudaThreadSynchronize()保证所有的流在进一步执行前已经完成
4,5,6,
7,8,9};
虽说 共享内存 在一个块内的线程都可以访问,但是
关于关键字:_syncthreads(),共享内存只有在执行_syncthreads()后才能使共享变量对其他线程可见。用于块内同步
theRNG产生的是0到1间的浮点数
一:数组int a[
3][3]={1,2,3,
给多维数组定义,可以不指定行,但必须指定列
a[x][y]存储的是a的第x行,第y列。不是按数学坐标系中的坐标来的
二:
tex2D( rT, x, y);取的是rT所绑定的二维数组T的T[y][x],即T的第y行第x列
三:
关于opencv里的Mat,如果一个图像宽320,高240,那么存到Mat里后,Mat.rows是图像的行数,也即高240;Mat.cols是图像的列数,也即宽320。
Mat.at(x,y),是Mat的第x行,第y列,也即图像的第x行,第y列
数组是按行存储的