异步性的概念heterogeneity,一个程序又在cpu上跑,又在gpu上跑,就是异步性
GPU适合 Single Instruction Multiple Data (SIMD) 单指令多数据,类似于数组运算。
CPU设计的要点就是低延迟访问( low latency access)。
关键词
__global__:函数之前加上这个关键词,那么告诉编译器这个函数是在GPU里面运行的,但是这个函数是由CPU调用的,并且这个函数的返回类型都是void。
kernels:算法的并行部分
<<<,>>>::告诉编译器,这个调用的gpu函数。