机器学习之过拟合的解决方法

过拟合

过拟合,是指模型在训练集上表现的很好,但是在交叉验证集合测试集上表现一般,也就是说模型对未知样本的预测表现一般,泛化(generalization)能力较差。

这里写图片描述

一般防止过拟合的方法有early stopping、数据集扩增(Data augmentation)、正则化(Regularization)、Dropout等。

Early stopping:

在模型对训练数据集迭代收敛之前停止迭代来防止过拟合。

正则化

指的是在目标函数(损失函数)后面添加一个正则化项,一般有L1正则化与L2正则化。L1正则是基于L1范数,即参数绝对值之和与参数的乘积。

C=C0+λn|ω| C = C 0 + λ n ∑ | ω |

L2正则是基于L2范数,即在目标函数后面加上参数的L2范数和项,即参数的平方和与参数的乘积。

C=C0+λ2nω2 C = C 0 + λ 2 n ∑ ω 2

数据集扩增

有效的数据集扩增方法:
1)从数据源头采集更多数据
2)复制原有数据并加上随机噪声
3)重采样
4)根据当前数据集估计数据分布参数,使用该分布产生更多数据等

DropOut:

简单说就是在神经网络中,对隐藏层的神经元随机的进行隐藏,认为这些神经元不存在,即不参与当前次训练,同时保持输入层与输出层神经元的个数不变。下一次迭代中,同样随机删除一些神经元,与上次不一样,做随机选择。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值