最近两天在调试cuda程序,总结句话:
1、CPU程序不能直接访问显存,否则出错。
2、同样,GPU程序不能访问主存,否则同样出错。
3、为了效率,尽可能把程序拆分成并行运算。
4、尽量减少主存和内存之间的数据拷贝,如果可能使用异步拷贝。
5、如果数据存储时间大于计算时间,还是考虑用CPU运算吧,GPU不合适。
最近两天在调试cuda程序,总结句话:
1、CPU程序不能直接访问显存,否则出错。
2、同样,GPU程序不能访问主存,否则同样出错。
3、为了效率,尽可能把程序拆分成并行运算。
4、尽量减少主存和内存之间的数据拷贝,如果可能使用异步拷贝。
5、如果数据存储时间大于计算时间,还是考虑用CPU运算吧,GPU不合适。