关于cuda和cudnn版本的一个问题?
今天LZ进行inference测试的时候,以前倒是真的没有太在意,觉得cuda和cudnn版本只要对应匹配就没有什么太大问题,但是这次训练的模型,在不同版本的cuda和cudnn上测试,结果确相差甚远,用的是相同的代码和模型,LZ一度认为是不是模型保存错了,或者代码写的不一致的问题.
因为是pixel2pixel的,所以inference结果是像素级的,现在存在的问题是肉眼可观的存在差异,今天一个同事也遇到了类似的问题,使用不同的环境复现论文时,效果降了5-6个点,这是否说明以后炼丹或者部署都得在相同的cuda和cudnn版本呢,按理说不应该出现这种依赖库环境的问题,不知道有没有小伙伴对这方面比较了解的呢? (对炼丹炉的型号也有要求了???)
这个就抛出一个问题,也许以后有更加深入的理解后,再进行更新.