之前都是用32位进行debug,突然想用64位的了。一测试结果CUDA结果与CPU结果不一致,浮点精度不一致。经过一番测试,发现是double的事情。将CUDA C/C++-------Device----------Code Generation 至少改成comute_13就可
以了。因为从1.3才开始支持双精度。只是个小细节而已,记录一下
CUDA编译结果与CPU结果不一致
最新推荐文章于 2023-06-01 17:11:56 发布