cuda HelloWorld 之 矩阵相加 1. cudaMalloc2. 主机内存拷贝到Device3. 运行 Kernel 函数4. 等待完成将结果拷贝至主机5. cudaFree 1. cudaMalloc 2. 主机内存拷贝到Device 输入参数 3. 运行 Kernel 函数 4. 等待完成将结果拷贝至主机 5. cudaFree