cuda编程基础:矩阵加减、点乘
cuda编程基础:矩阵加减、点乘矩阵加减Device 单个block例子Device 多个block例子Matrix Multiply矩阵相乘HostDevice 单个block例子Device 多个block例子
矩阵加减
Device 单个block例子
每个线程块block中,线程数量有上限(eg.512/1024)
// kernel definition
__global__ void MatAdd(float A[N][N], float B[N][N], float C[N][N])
{
原创
2021-07-01 14:57:39 ·
966 阅读 ·
0 评论