机器学习之过拟合的解决方法

最新推荐文章于 2023-12-25 17:29:31 发布

blank_tju

最新推荐文章于 2023-12-25 17:29:31 发布

阅读量335

点赞数

文章标签：过拟合机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blank_tj/article/details/82465579

版权

过拟合

过拟合，是指模型在训练集上表现的很好，但是在交叉验证集合测试集上表现一般，也就是说模型对未知样本的预测表现一般，泛化（generalization）能力较差。

这里写图片描述

一般防止过拟合的方法有early stopping、数据集扩增（Data augmentation）、正则化（Regularization）、Dropout等。

Early stopping:

在模型对训练数据集迭代收敛之前停止迭代来防止过拟合。

正则化

指的是在目标函数（损失函数）后面添加一个正则化项，一般有L1正则化与L2正则化。L1正则是基于L1范数，即参数绝对值之和与参数的乘积。

$C = C_0 + \frac{\lambda}{n}\sum|\omega|$

L2正则是基于L2范数，即在目标函数后面加上参数的L2范数和项，即参数的平方和与参数的乘积。

$C = C_0 + \frac{\lambda}{2n}\sum \omega^2$

数据集扩增

有效的数据集扩增方法：
1）从数据源头采集更多数据
2）复制原有数据并加上随机噪声
3）重采样
4）根据当前数据集估计数据分布参数，使用该分布产生更多数据等

DropOut：

简单说就是在神经网络中，对隐藏层的神经元随机的进行隐藏，认为这些神经元不存在，即不参与当前次训练，同时保持输入层与输出层神经元的个数不变。下一次迭代中，同样随机删除一些神经元，与上次不一样，做随机选择。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之过拟合的解决方法

过拟合过拟合，是指模型在训练集上表现的很好，但是在交叉验证集合测试集上表现一般，也就是说模型对未知样本的预测表现一般，泛化（generalization）能力较差。一般防止过拟合的方法有early stopping、数据集扩增（Data augmentation）、正则化（Regularization）、Dropout等。Early stopping:在模型对训练数据集迭代...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。