改善深层神经网络:超参数调整、正则化以及优化——2.5 指数加权平均的偏差修正

在这里插入图片描述
β = 0.98 \beta=0.98 β=0.98时,其实预测曲线是图中的紫色线,在一开始的时候由于 v 0 = 0 v_0=0 v0=0,导致前面部分的值低于预期的实际值,为了解决这个问题,加入了偏差修正。
v t = β v t − 1 + ( 1 − β ) θ t v_t=\beta v_{t-1}+(1-\beta)\theta_t vt=βvt1+(1β)θt在指数加权平均早期,因为设定 v 0 = 0 v_0=0 v0=0 v 1 = 0.98 ∗ v 0 + 0.02 ∗ θ 1 v_1=0.98*v_0+0.02*\theta_1 v1=0.98v0+0.02θ1,因为 v 0 = 0 v_0=0 v0=0,所以 v 1 = 0.02 ∗ θ 1 v_1=0.02*\theta_1 v1=0.02θ1,如果第一天温度是40华氏度,那么 v 1 = 8 v_1=8 v1=8,得到的值会小很多,所以第一天温度的估测不准。 v 2 = 0.0196 ∗ θ 1 + 0.02 ∗ θ 2 v_2=0.0196*\theta_1+0.02*\theta_2 v2=0.0196θ1+0.02θ2

有个办法可以修改这一估测,让估测变得更好,更准确,特别是在估测初期。也就是不用 v t v_t vt,而是用 v t 1 − β t \frac{v_t}{1-\beta^t} 1βtvt,公式中的t是指现在的天数。

举个具体例子,当t=2时, 1 − β t = 1 − 0.9 8 2 = 0.0396 1-\beta ^t=1-0.98^2=0.0396 1βt=10.982=0.0396。因此对第二天温度的估测变成了 v 2 0.0396 = 0.0196 ∗ θ 1 + 0.02 ∗ θ 2 0.0396 \frac{v_2}{0.0396}=\frac{0.0196*\theta_1+0.02*\theta_2}{0.0396} 0.0396v2=0.03960.0196θ1+0.02θ2

随着t的增加,公式中的 β t \beta ^t βt的t次方将接近于0。所以当t很大的时候,偏差修正几乎没有作用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值