深度学习笔记

Ms. Groves

已于 2022-04-15 20:20:48 修改

阅读量770

点赞数

文章标签：深度学习

于 2022-04-08 17:46:19 首次发布

本文链接：https://blog.csdn.net/i_Harry_/article/details/124047044

版权

批量归一化(BN)是深度学习中的一种重要技术，通过减均值除方差来平滑损失函数，提升模型的泛化能力。BN在网络结构中常与卷积层结合，能加速推理过程。然而，池化操作可能会丢失低级特征。在处理批处理图像时，要求图像尺寸一致以便于张量拼接。BN的作用相当于正则项，使得模型在训练时考虑更多样本信息，提高预测的准确性。

摘要由CSDN通过智能技术生成

基础概念

模型优化

BN
$y=\frac{x-E[x]}{\sqrt{Var[x]+\epsilon }}\ast \gamma +\beta$
即减均值除方差(其实是标准差)，然后乘以一个权重加上一个系数。

BN效果好是因为BN的存在会引入mini-batch内其他样本的信息，就会导致预测一个独立样本时，其他样本信息相当于正则项，使得loss曲面变得更加平滑，更容易找到最优解。相当于一次独立样本预测可以看多个样本，学到的特征泛化性更强，更加general。
常见的网络大都是Conv+BN结构，可以融合为Conv加速推理，详见。
Pooling经常会损失一些低级特征。
如果想成批处理图像，同一批内图像必须有确定的宽和高，因为涉及到张量的拼接。

Ms. Groves

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习笔记

模型优化BNy=x−E[x]Var[x]+ϵ∗γ+βy=\frac{x-E[x]}{\sqrt{Var[x]+\epsilon }}\ast \gamma +\betay=Var[x]+ϵx−E[x]∗γ+β即减均值除方差(其实是标准差)，然后乘以一个权重加上一个系数。BN效果好是因为BN的存在会引入mini-batch内其他样本的信息，就会导致预测一个独立样本时，其他样本信息相当于正则项，使得loss曲面变得更加平滑，更容易找到最优解。相当于一次独立样本预测可以看多个样本，学到的特征泛
复制链接

扫一扫