非常费解在visual studio下,cuda编程中会出现debug模式和release模式结果不同的情况。
我们知道Release会去掉很多编译和调用信息,但是出现结果误差真是让人费解。
查阅CUDA开发文档,发现use_fast_math。。。原来默认状态下release版本下的cuda为了速度快居然牺牲了精度
Name |
Description |
use_fast_math |
Make use of fast math library. --use_fast_math implies --ftz=true --prec-div=false |