深度学习之参数、超参数、正则化

1.参数 VS 超参数

1.1 什么是超参数(Hyperparameters )?

在这里插入图片描述

1.2 如何寻找超参数的最优值?

在这里插入图片描述

这可能的确是深度学习比较让人不满的一部分,也就是你必须尝试很多次不同可能性。

2.神经网络中的正则化

在深度学习神经网络中,除了传统的L2正则化,还有Dropout正则化方式,正则化的目的在于降低模型的过拟合程度,除了常用的这两种方式,降低过拟合程度还可以采用数据扩增和early stopping的方式。

2.1 L2正则化

在之前的机器学习第三周的文章中,我们介绍了线性回归和逻辑回归中的正则化,这种正则化方式称为:L2正则化

2.2 Dropout正则化

在深度学习模型中,由于引入了神经元,故正则化的方式也有新的方式,我们可以采用Dropout正则化(Dropout Regularization),Dropout当然不能翻译为辍学,其意思为随机失活,即对神经网络中的神经元做随机失活处理。

在这里插入图片描述

假设你在训练上图这样的神经网络,它存在过拟合,这就是 dropout 所要处理的,我们复制这个神经网络, dropout 会遍历网络的每一层,并设置消除神经网络中节点的概率。假设网络中的每一层,每个节点都以抛硬币的方式设置概率,每个节点得以保留和消除的概率都是 0.5,设置完节点概率,我们会消除一些节点,然后删除掉从该节点进出的连线,最后得到一个节点更少,规模更小的网络,然后用 backprop 方法进行训练。

在这里插入图片描述

在这里插入图片描述

这是网络节点精简后的一个样本,对于其它样本,我们照旧以抛硬币的方式设置概率,保留一类节点集合,删除其它类型的节点集合。对于每个训练样本,我们都将采用一个精简后神经网络来训练它,这种方法似乎有点怪,单纯遍历节点,编码也是随机的,可它真的有效。

简单来说,dropout正则化不仅可以精简网络,加速训练,还可以防止过拟合。dropout如何实施?方法有很多,常用的有inverted dropout,具体内容参考视频:https://mooc.study.163.com/learn/2001281003?tid=2001391036

2.3 数据扩增

假设你正在拟合猫咪图片分类器,如果你想通过扩增训练数据来解决过拟合,但扩增数据代价高,而且有时候我们无法扩增数据,但我们可以通过添加这类图片来增加训练集。例如,水平翻转图片,并把它添加到训练集。所以现在训练集中有原图,还有翻转后的这张图片,所以通过水平翻转图片,训练集则可以增大一倍,因为训练集有冗余,这虽然不如我们额外收集一组新图片那么好,但这样做节省了获取更多猫咪图片的花费。

在这里插入图片描述

除了水平翻转图片,你也可以随意裁剪图片,这张图是把原图旋转并随意放大后裁剪的,仍能辨别出图片中的猫咪。通过随意翻转和裁剪图片,我们可以增大数据集,额外生成假训练数据。和全新的,独立的猫咪图片数据相比,这些额外的假的数据无法包含像全新数据那么多的信息,但我们这么做基本没有花费,代价几乎为零,除了一些对抗性代价。以这种方式扩增算法数据,进而正则化数据集,减少过拟合比较廉价。

像这样人工合成数据的话,我们要通过算法验证,图片中的猫经过水平翻转之后依然是猫。大家注意,我并没有垂直翻转,因为我们不想上下颠倒图片,也可以随机选取放大后的部分图片,猫可能还在上面。
对于光学字符识别,我们还可以通过添加数字,随意旋转或扭曲数字来扩增数据,把这些数字添加到训练集,它们仍然是数字。为了方便说明,我对字符做了强变形处理,所以数字 4 看起来是波形的,其实不用对数字 4 做这么夸张的扭曲,只要轻微的变形就好,我做成这样是为了让大家看的更清楚。实际操作的时候,我们通常对字符做更轻微的变形处理。因为这几个 4 看起来有点扭曲。所以,数据扩增可作为正则化方法使用,实际功能上也与正则化相似。

2.4 early stopping

early stopping顾名思义,就是及早停止的意思,意味着在训练神经网络模型中及早的停止训练。那么在哪里停止?为什么要停止?

因为在训练过程中,我们希望训练误差,损失函数越来越小,我们可以绘制训练误差或损失函数J和迭代次数的关系曲线,同时,我们也可以用验证集来绘制同样的曲线,通常验证集的误差却会经历先下降后上升的过程,于是这个最低点就是我们需要停止训练的点。

在这里插入图片描述

在这里插入图片描述

优点:

Early stopping 的优点是,只运行一次梯度下降,你可以找出w的较小值中间值和较大值,而无需尝试L2正则化超级参数λ的很多值。节约了模型训练的时间。

缺点:

及早停止了训练,可能过拟合程度降低了,但是模型的损失J并没有降低到最小,即模型并未达到全局最优。

  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

辣椒种子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值