过拟合和欠拟合（一）

最新推荐文章于 2022-11-11 21:52:31 发布

不爱夏天的夏天啦

最新推荐文章于 2022-11-11 21:52:31 发布

阅读量212

点赞数

分类专栏：深度学习基础文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/natsumela/article/details/120968831

版权

在这里插入图片描述

我们来看吴恩达教授预测房价的例子
左边的图可以看到是一个线性拟合图，可以看到面积越大其房价越高。但实际数据分布则是房价高到一定程度会趋于平缓。我们认为该模型和实际数据之间存在一定的偏差。
这种不能很好的拟合实际数据的情况，即为欠拟合（高偏差）
右边的图可以看到是一个扭曲的多元曲线图，它在我们的训练数据上做了一个很好的拟合，但在测试数据上会过拟合，不具备泛化性，我们认为该模型对训练数据过度拟合
这种过度拟合训练数据，对其他数据不具备泛化性的情况，即为过拟合（高方差）

过拟合常常发生在一个变量或特征过多的情况

在变量过多时，如果此时我们的训练数据过少，则有可能会出现过拟合（因为变量过多，训练数据很少的情况下，模型几乎是完全为训练集打造的）
当特征过多时，有可能会出现相对不相关的特征；且特征过多意味着样本在特征空间是稀疏的，模型对样本的个性拟合大于共性，可能会出现过拟合
这两种都是对过拟合情况有影响的，并不是因果的关系。

如何避免过拟合问题？

可以考虑舍弃一些

最低0.47元/天解锁文章

不爱夏天的夏天啦

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
过拟合和欠拟合（一）

我们来看吴恩达教授预测房价的例子左边的图可以看到是一个线性拟合图，可以看到面积越大其房价越高。但实际数据分布则是房价高到一定程度会趋于平缓。我们认为该模型和实际数据之间存在一定的偏差。这种不能很好的拟合实际数据的情况，即为欠拟合（高偏差）右边的图可以看到是一个扭曲的多元曲线图，它在我们的训练数据上做了一个很好的拟合，但在测试数据上会过拟合，不具备泛化性，我们认为该模型对训练数据过度拟合这种过度拟合训练数据，对其他数据不具备泛化性的情况，即为过拟合（高方差）过拟合常常发生在一个变量或特征过多的情况.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。