我用cuda对RGBA图像进行高斯滤波,输入图像和输出图像都用uchar4,cuda内置类型,然后将原图像绑定到纹理,输出uchar*为处理后的图像,但是问题是线程数选16和32没问题,但64,128……结果像素全乱,但如果先用32运行一次,在改线程数为64,128……结果又是对的了。是跟合并访问有关,还是warp的线程数为32有关呢?会是哪除出了问题?
关于cuda编程的一个问题(求解)
最新推荐文章于 2022-06-01 09:19:55 发布