在官网上找的练习,
代码本身有一定的问题,各种在修改。
需要添加
#include<stdlib.h>
#include<cuda_runtime.h>
另外其中的checkCUDAError函数不知道为什么一直有问题
而且↓
cudaMalloc,变量一<1ms
变量二分配的内存就需要504ms了
其他命令都<1ms
在官网上找的练习,
代码本身有一定的问题,各种在修改。
需要添加
#include<stdlib.h>
#include<cuda_runtime.h>
另外其中的checkCUDAError函数不知道为什么一直有问题
而且↓
cudaMalloc,变量一<1ms
变量二分配的内存就需要504ms了
其他命令都<1ms