机器学习（二）——预测房价第二篇

最新推荐文章于 2023-10-24 22:45:57 发布

QuinnChuh

最新推荐文章于 2023-10-24 22:45:57 发布

阅读量608

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/quinnchuh/article/details/79589172

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

写在前面：第一篇做了一个引入，讲了简单的线性回归，有兴趣可以点开查看一下。

2.　评估过拟合

在机器学习中过拟合的情况是最经常发生的，过拟合就是说，我们呢得到的模型的泛化能力是比较差的。１３阶的比不过２阶的，这就引入了一个问题：到底多少阶数的模型才是最好的拟合模型呢？

2.1　训练与测试分开

在我们实际的应用中，我们的数据集是有限的，而把所有的数据集全部拿去训练，则会发生过拟合的现象，所以这里引入了一个观点就是将数据集划分称两部分：训练集和测试集。我们可以将我们的数据分成两部分，一部分拿来训练，一部分拿来测试：

通过这样的分离，我们便得到了两个误差：训练误差和测试误差。

2.2　训练／测试误差

实际上训练误差和测试误差的曲线是下面这样的：

从上面可以看到，即使你的模型复杂度越高，即阶数越高，但是测试误差是有一个反升的过程，所以，我们必须找到一个测试误差的最小值，从而找到我们的最适模型。

3. 加入其它新的特征

实际上并不只是有房屋的大小就能决定房屋的价格吗？并不是，我们只是单独的考虑了一个特征，所以我们需要引入一些新的特征。例如加入一个澡堂的数量，得到了下面的图像：

这样便从二维的模型变为了三维的模型，其模拟的便是图中的那个平面。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（二）——预测房价第二篇

写在前面：第一篇做了一个引入，讲了简单的线性回归，有兴趣可以点开查看一下。2.　评估过拟合在机器学习中过拟合的情况是最经常发生的，过拟合就是说，我们呢得到的模型的泛化能力是比较差的。１３阶的比不过２阶的，这就引入了一个问题：到底多少阶数的模型才是最好的拟合模型呢？2.1　训练与测试分开在我们实际的应用中，我们的数据集是有限的，而把所有的数据集全部拿去训练，则会发生过拟合的现象，所以这里引入了一个观...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。