机器学习模型的容量，过拟合与欠拟合

最新推荐文章于 2022-11-03 10:06:42 发布

qq_34872215

最新推荐文章于 2022-11-03 10:06:42 发布

阅读量1.1k

点赞数 1

分类专栏：机器学习文章标签：机器学习

原文链接：https://blog.csdn.net/LoseInVain/article/details/78108990

版权

机器学习专栏收录该内容

2 篇文章 1 订阅

订阅专栏

容量(capacity)

通过调节机器学习模型的容量，可以控制模型是否偏于过拟合还是欠拟合。

容量从本质上说是描述了整个模型的拟合能力的大小。

如果容量不足，模型将不能够很好地表示数据，表现为欠拟合；

如果容量太大，那么模型就很容易过分拟合数据，因为其记住了不适合与测试集的训练集特性，表现为过拟合。

因此控制好模型的容量是一个关键问题。

容量的控制可以通过多种方法控制，包括：
* 控制模型的假设空间。
* 添加正则项对模型进行偏好排除。
上面的两种方法会降低模型的容量

模型的假设空间

　　假设空间(hypothesis space)指的是算法可以作为解决方案的函数集合。是输入空间到输出空间的映射的集合。

模型的表示容量和有效容量

事实上，模型的最大容量被称为表示容量(representational capacity)，指的是通过调节参数降低训练目标时，学习算法可以从哪些函数族中选择函数。实际上，从这些函数中挑选出最优函数是一个极为困难的事情，额外的限制，比如优化算法的不完美，使得模型的有效容量(effective capacity)可能会小于表示容量。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习模型的容量，过拟合与欠拟合

容量(capacity) 通过调节机器学习模型的容量，可以控制模型是否偏于过拟合还是欠拟合。容量从本质上说是描述了整个模型的拟合能力的大小。如果容量不足，模型将不能够很好地表示数据，表现为欠拟合；如果容量太大，那么模型就很容易过分拟合数据，因为其记住了不适合与测试集的训练集特性，表现为过拟合。因此控制好模型的...
复制链接

扫一扫

专栏目录

qq_34872215 CSDN认证博客专家 CSDN认证企业博客

码龄8年

20: 原创

31万+: 周排名

33万+: 总排名

15万+: 访问

: 等级

1467: 积分

28: 粉丝

150: 获赞

11: 评论

551: 收藏

私信

关注

热门文章

分类专栏

广告推荐 1篇
c++ 15篇
Java 1篇
大数据 3篇
C 2篇
深度学习 7篇
word embedding 1篇
语言模型 1篇
attention机制 1篇
RNN 1篇
参数估计 1篇
最小二乘 1篇
极大似然估计 1篇
梯度下降 1篇
交叉熵 1篇
均方差 1篇
python 5篇
条件随机场 1篇
脚本语言 3篇
二进制 1篇
机器学习 2篇

最新评论

c语言关于引用&的使用
Jerry Booth: 并没有交换地址，是通过辅助变量t，修改了x,y所指地址上的值
c语言关于引用&的使用
m0_55928057: 感谢😊
深度学习——attention机制
Tisfy: 得君此文兮，欣然欢喜。
java虚拟机是什么？
lunvey: 好文，让我明白了虚拟Java编程语言,期待下次后续
平方损失函数与交叉熵损失函数 & 回归问题为何不使用交叉熵损失函数
dugutianhe: 博主你好，4.1那个直观理解没有问题吗？交叉熵后面还有一项是针对负类，即-（1-y）*log(1-p)，对于标签y=0的时候，log损失会让（1-p）趋近于1，即负类别的p趋近于0。所以您说的“交叉熵损失只和分类正确的类别有关”是不是有待商榷。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。