pytorch train和eval 效果不同的原因

问题简要描述:

pytorch 中 model train 模式和eval 模式效果差异比较大,问题排查。没有使用到dropout 这个也是一个点

问题详细描述

bn的讲解

批量内某个通道进运算 X = gamma(X-mean)/var + beta
torch 中gamma 用weight 表示,beta 用bias表示,这个没有什么问题。 weight 和bias是可以训练的

训练时候的mean val的计算

训练的时候是计算当前batch 的mean, 比如当前(16, 20, 256, 256)那就是16张256x256的feature map的mean和val

eval时候的mean val

mean 和val 是训练中获得的, 不是由当前batch 计算的,也就是说,无论当前的batch 是 16, 20, 30 这里的mean和val都不会变

eval 中的mean 和val 是怎么从训练中得到的呢?

bn 参数

nn.BatchNorm2d(171, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

假设

  1. train总共 10次迭代,我们选择20个channel 中的第0个channel 来测试
  2. m*, v* 表示当前batch 计算到的均值和方差
  3. mean*,val* 表示如果当前停止训练,用于eval的均值和方差

训练步骤

itercurrent meancurrent valrunning meanrunning val
初始化01
第1次训练m1v10*0.9 + 0.1 *m1=mean 11* 0.9 + 0.1* v1 = val1
第2次训练m2v2mean1*0.9 + 0.1 *m2=mean 2val1* 0.9 + 0.1* v2 = val2
第3次训练m3v3mean2*0.9 + 0.1 *m3=mean 3val2* 0.9 + 0.1* v3 = val3

tain 和eval 不同的原因

  1. error: bn 混用,实例化了一个bn,在不同的层之间使用训练的时候没问题; 测试的时候,running mean running val 只存了一组,所以产生了问题
  2. error:momentum = 0, 训练的时候不更新,始终是初始化的东西,所以精度也会不高
  3. right: bn 默认设置,一张照片的数据集,进行train 和eval 效果也不同,
    训练的时候使用的是这一张照片的均值,测试的时候使用的这一张照片的均值的动量法,初始值是0,经过很多很多次训练才是一张照片的均值, 这个是哈eval和trian 才相同,为了加快测试速度可以将动量从0.1 调为0.9
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值