机器学习：偏差、方差与正则化

最新推荐文章于 2022-10-09 00:52:47 发布

Paul-LangJun

最新推荐文章于 2022-10-09 00:52:47 发布

阅读量2.2k

点赞数

分类专栏：机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/80994468

版权

神经网络同时被 2 个专栏收录

45 篇文章 7 订阅

订阅专栏

35 篇文章 3 订阅

订阅专栏

1. 偏差和方差

1.1 偏差

通俗的讲，偏差反映的模型学习的好坏程度或者捕捉训练集主要特征的能力大小。偏差大意味着学习不够充分，主要特征没有捕捉到；偏差小意味着学习充分，捕捉到了训练集中的主要特征，当然这也存在过拟合的风险。

偏差较大的原因：训练不充分、数据规模大但模型过于简单（常见于神经网络）等

1.2 方差

通俗的讲，方差反映的是模型举一反三的学习能力，即在测试集上的学习表现。若在测试集上的表现好，则方差小；若在测试集上的表现不好，则方差大。

方差较大的原因：数据规模小（噪音存在的概率大），训练过于充分

1.3 偏差与方差的均衡

一般来说，偏差与方差此消彼长，方差大则偏差小，偏差大则方差小。在模型训练过程中，需要通过一些方法来确保模型在偏差不是太大的前提下保证方差也不是太大。

2. 正则化

机器学习中经常出现模型学习的过于“好”的现象，导致在测试集上的分类精度不高，方差过大，这就是所谓的过拟合。为此，将正则化机制引入损失函数，以减弱模型的过拟合效应。

常见的正则化机制有L1（矩阵的1范数）正则化和L2（矩阵的2范数）正则化，下面结合损失函数予以介绍。

2.1 经L1和L2正则化损失函数的形式

上述定义形式详见点击打开链接。

2.2 正则化效果

经L1范数正则后的损失函数倾向于使部分待优化参数的值等于于0，从而简化模型，削弱过拟合。因此，L1范数有稀疏参数的作用。

经L2范数正则后的损失函数倾向于使得参数的值较小，从而简化模型，削弱过拟合。其中，在神经网络中应用L2正则化可以实现权值衰减：

详见点击打开链接

再深入一点，权值衰减为何会削弱过拟合效应那？见下图

以tanh激活函数为例进行解释，当权值减小后，Z值随之减少，激活函数的作用区域（如坐标轴红色标注处）将大致呈线性，整个神经网络的非线性因素减少，一定程度上阻碍了模型的“过充分”学习，进而削弱了过拟合效应，sigmod激活函数也可以类似的进行解释。当然，这个仅作为直觉上的解释，理论解释尚需进一步研读其它相关文献。引自点击打开链接

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习：偏差、方差与正则化

1. 偏差和方差1.1 偏差通俗的讲，偏差反映的模型学习的好坏程度或者捕捉训练集主要特征的能力大小。偏差大意味着学习不够充分，主要特征没有捕捉到；偏差小意味着学习充分，捕捉到了训练集中的主要特征，当然这也存在过拟合的风险。偏差较大的原因：训练不充分、数据规模大但模型过于简单（常见于神经网络）等1.2 方差通俗的讲，方差反映的是模型举一反三的学习能力，即在测试集上的学习表现。...
复制链接

扫一扫

专栏目录

Paul-LangJun CSDN认证博客专家 CSDN认证企业博客

码龄12年

161: 原创

3万+: 周排名

8583: 总排名

41万+: 访问

: 等级

4574: 积分

125: 粉丝

309: 获赞

85: 评论

1129: 收藏

私信

关注

热门文章

分类专栏

c
java 31篇
c++ 14篇
数据结构与算法 45篇
重构 2篇
数据库 5篇
android 8篇
设计模式 6篇
面向对象 14篇
多线程 16篇
think in life
Linux 11篇
机器学习 35篇
概率与统计 21篇
神经网络 45篇
Python 18篇
大数据 3篇
分布式 6篇
爬虫 1篇
正则表达式 1篇
线性代数 7篇
最优化方法 4篇
前端技术

最新评论

深度学习中的He初始化
Paul-LangJun: y = wx, 相当于多个均值为0的对称分布的加权，其最终的变量y的分布也是均值为0的对称分布，可以搜下概率轮方面的材料
深度学习中的He初始化
一个学数学的程序媛: yl−1 以0为中心形成对称分布，请教下这是为什么呢。
没有思考过 Embedding，不足以谈 AI（转）
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
矩阵乘法的优化
Jack1号: 约等于 int i=0
SENet概览
因吹斯挺828: 可以使用，这里指特征维度的通道，和RGB的3通道是有区别的。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。