归一化/标准化/正则化

最新推荐文章于 2022-03-02 23:24:45 发布

mrcoderrev

最新推荐文章于 2022-03-02 23:24:45 发布

阅读量342

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yjf3151731373/article/details/103131461

版权

目标检测专栏收录该内容

10 篇文章 0 订阅

订阅专栏

为什么要进行归一化和标准化？

因为特征间的单位尺度可能不同，可能会导致计算结果也不同，尺度大的会起决定性作用，为了消除特征间的单位和尺度差异和影响，以对每维特征同等看待，需要对特征进行归一化操作。

因尺度差异，其损失函数的等高线可能是椭圆形，梯度方向垂直于等高线，下降会走zigzag路线，而不是指向local minimum,通过对特征进行平均值为0方差为1的变换后，其损失函数的等高线更接近圆形，梯度下降的方向震荡更小，收敛更快。
在这里插入图片描述

rescaling(min-max normalization, range scaling)
将每一维特征映射到[a,b],常用目标范围为[0,1]和[-1,1]
$+\frac {(x-min(x))(b-a)}{max(x)-min(x)}$

mean normalization
均值为0
$+\frac {(x-\overline{x})}{max(x)-min(x)}$

标准化
均值为0标准差为1
$+\frac {(x-\overline{x})}{\sigma}$

为什么要做特征归一化/标准化

正则化

高bias往往意味着欠拟合，高variance往往意味着过拟合。
（1）高bias我们可以用以下几种方法来改进
更复杂更大的网络结构（增加单元数，增加层数，更改结构）
训练更长的时间（增加迭代次数）
（2）高variance我们可以用正则化来解决
给损失函数加一个正则项(一般采用L2正则化)，增加dw，减小w，使模型变得更简单，泛化能力更强。

$\overline{J}(\theta;X,y)=J(\theta;X,y)+\alpha\Omega(\theta)$
L2正则化：
$\overline{J}(\theta;X,y)=J(\theta;X,y)+\alpha\frac{1}{2}||w||^2_2$

小结深度学习中的正则化（超详细分析）
例如：
dropout:随机丢弃神经元，不敢给任何神经元过大的参数。
（暂时性失活）
early-stoping:减少训练时间，见好就收
深度学习中的正则化（Regularization)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
归一化/标准化/正则化

为什么要进行归一化和标准化？因为特征间的单位尺度可能不同，可能会导致计算结果也不同，尺度大的会起决定性作用，为了消除特征间的单位和尺度差异和影响，以对每维特征同等看待，需要对特征进行归一化操作。因尺度差异，其损失函数的等高线可能是椭圆形，梯度方向垂直于等高线，下降会走zigzag路线，而不是指向local minimum,通过对特征进行平均值为0方差为1的变换后，其损失函数的等高线更接近圆形，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。