李宏毅2021春机器学习课程笔记--类神经网络(五)

Batch normalization

将error surface的山铲平

change landscape

通过改变w,改变y,进而改变e,而对于不同量级的x,会产生不同的Δ,所以进行归一化:
在这里插入图片描述
在这里插入图片描述
feature normalization之后,样本之间的关系由独立变成彼此关联。样本数取决于batch
在这里插入图片描述

testing = inference

μ σ 通过batch算出,
test时pytorch会保留训练时的μ和sigma
这样测试时不必取到所有batch才能预测

internal covariate shift?

实验表明 不是特别大的问题,且batch norm会让 error surface 更平坦

其他方案

还有代替的发现
serendipitous

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值