机器学习（一）—— 过拟合（Overfitting）、正则化与损失函数

最新推荐文章于 2024-05-09 09:07:45 发布

weixin_42886817

最新推荐文章于 2024-05-09 09:07:45 发布

阅读量594

点赞数

分类专栏：机器学习文章标签：机器学习过拟合正则化损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42886817/article/details/99679966

版权

机器学习专栏收录该内容

16 篇文章 7 订阅

订阅专栏

过拟合、正则化和损失函数

什么是过拟合
如何解决过拟合？
- 正则化（regularization）
- Dropout正则化（丢弃正则化）
损失函数

什么是过拟合

过拟合：经训练出的模型在训练集上表现很好，可能将训练集的一些特点当做所有样本都具有的特点，导致在新的样本上的误差变大，泛化能力差。

过拟合的原因：

网络的学习能力过好
数据样本过少

欠拟合：对训练集的一般性质尚未学好

如何解决过拟合？

方法一：增加数据量
方法二：运用正则化regularization（L1,L2,…）

正则化（regularization）

W表示权重，x表示输入，y表示输出
real y表示真实输出，λ表示系数

正则化	cost函数
原始损失函数（无正则化）	设为C
L1正则化	cost=C+λ ∑ abs(w)
L2正则化	cost=C+λ ∑w²

L3,L4正则化以此类推

Dropout正则化（丢弃正则化）

所谓dropout(丢弃)，就是去除一些神经元之间的连接。

这样做对于解决过拟合问题有什么好处呢：

丢弃一些连接，意味着网络规模减小
随机丢弃，不会偏重某些权重，类似 L2正则化

其涉及的相关概念：

保留概率 keep-prob :描述一个隐藏层保留神经元（连接）的概率，作用是为了生成随机矩阵
反向随机失活 inverted dropout：用来实现dropout

损失函数

参考原文链接：
版权声明：本文为博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。
本文链接： https://blog.csdn.net/chkay399/article/details/81878157

在上面正则化中提到了损失函数的概念，损失函数是用来估量训练出的模型的预测值与真实值之间的差距
接下来介绍一下机器学习里常用的的损失函数：

统一使用Y来表示真实数据集，X表示输入数据集合，f(X)表示预测值集合
y表示一条真实数据，x表示一条输入数据

平方损失函数（最小二乘法）

使用场景：线性回归

对数损失函数

使用场景：逻辑回归
样本预测值和实际值的误差符合高斯分布，使用极大似然估计的方法，取对数得到损失函数：

指数损失函数

使用场景：Boosting算法中较为常见

在这里插入图片描述

weixin_42886817

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（一）—— 过拟合（Overfitting）、正则化与损失函数

过拟合、正则化和损失函数什么是过拟合如何解决过拟合？正则化（regularization）损失函数平方损失函数（最小二乘法）对数损失函数指数损失函数什么是过拟合过拟合：经训练出的模型在训练集上表现很好，可能将训练集的一些特点当做所有样本都具有的特点，导致在新的样本上的误差变大，泛化能力差。欠拟合：对训练集的一般性质尚未学好如何解决过拟合？方法一：增加数据量方法二：运用正则...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。