过拟合（Overfitting)

最新推荐文章于 2021-03-07 12:46:33 发布

一抹烟霞

最新推荐文章于 2021-03-07 12:46:33 发布

阅读量125

点赞数

文章标签：神经网络深度学习机器学习正则化 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34213260/article/details/108659900

版权

过拟合

一、定义
二、过拟合的解决方案

一、定义

在训练数据集上的准确率很⾼，但是在测试集上的准确率⽐较低

在这里插入图片描述

二、过拟合的解决方案

2.1 DropOut

假设有一个过拟合的神经网络如下：

在这里插入图片描述

DropOut步骤：

根据DropOut rate(这里假设为 1/3)，在每组数据训练时，随机选择每一隐藏层的1/3的节点去除，并训练。如下图是三次训练的过程：
2. 使用时，把神经网络还原成原来没有去除过节点的样子，如下图。但是
系数_(w，b)需要乘以(1-DropOut rate)

2.2 L2 正则化

2.2.1 方法
对损失函数(loss function) f(θ) 中的每一个系数θ_i,都对损失函数加上1/2λθ_i²，其中λ是正则化的强度。

相当于，在训练的每一次更新系数的时候都额外加上这一步:θ_i= θ_i - λθ_i

2.2.2 目的
L2正则化的目的是使系数的绝对值减小，对绝对值越大的系数，减小的程度越强。L2正则化使得大多数系数的值都不为零，但是绝对值都比较小。

2.3 L1 正则化

2.3.1 方法
对损失函数(lossfunction)f(θ)中的每一个系数θ_i,都对损失函数
加上λ|θ_i|，其中λ是正则化的强度。

相当于，在训练的每一次更新系数的时候都额外加上这一步:

2.3.2 目的
L1正则化的目的是使得许多系数的绝对值接近0，其它那些系数不接近于0的系数对应的特征就是对输出有影响的特征。所以L1正则化甚至可以用于作为特征选择的工具。

2.4 最⼤范数约束 (Max Norm)

2.4.1 方法
对每一个神经元对应的系数向量，设置一个最大第二范数值c，这个值通常设为3。如果一个神经元的第二范数值大于c，那么就将每一个系数值按比例缩小，使得第二范式值等于c。

相当于在训练的每一次更新系数的时候都额外加上这一步:

注意：只有当||θ||>c才执行

2.4.2 目的
由于最大范数的约束，可以防止由于训练步长较大引发的过拟合。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
过拟合（Overfitting)

过拟合一、定义二、过拟合的解决方案2.1 DropOut2.2 L2 正则化2.3 L1 正则化2.4 最⼤范数约束 (Ma...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。