机器学习（5）-多项式回归

最新推荐文章于 2023-12-24 13:59:50 发布

qq_38248958

最新推荐文章于 2023-12-24 13:59:50 发布

阅读量561

点赞数

分类专栏：机器学习（派神）文章标签：机器学习 python 数据分析

本文链接：https://blog.csdn.net/qq_38248958/article/details/79973686

版权

机器学习（派神）专栏收录该内容

12 篇文章 2 订阅

订阅专栏

这篇博客探讨了如何使用多项式回归处理非线性问题，例如根据工龄和职位预测薪酬。通过实例展示了线性回归的不足，并逐步调整最高次数找到最佳的拟合度，最终确定在最高次数为4时预测结果最为准确。提供了源码和数据集的下载链接。

摘要由CSDN通过智能技术生成

多项式回归：
这里写图片描述
处理的是一些非线性问题，像一些无法用直线拟合的离散点，比方说随着工龄的增长和职位的升高而 增加的薪酬。
这样的问题，往往只有一个自变量。
多项式回归还是比较简单的
///举一个栗子///
一家企业：十个职位与对应的薪酬
这里写图片描述

这时候有一个人来你公司应聘，他已经在6职位上工作了两年多，还有几年就可以上到7职位了，你应该给他多少薪酬呢？
这种情况，我们就将他的职位按照6.5算吧。
下面这个是线性回归的预测出的结果

linr = LinearRegression()
linr.fit(X, y)
polyr = PolynomialFeatures(degree = 2)
linrr = LinearRegression()
linrr.fit(X_poly, y)

这里写图片描述
显而易见，误差是非常大的，尤其是看到了y轴上的数量级之后….
这时候让我们来用多项式回归，可以通过增加变量的最高次数，来增加拟合结果的准确性。

我们设定的多项式的最高次数是2，但是头尾两个数值的误差还是比较大的
在这个逐步调高最高次数的过程中，发现最高次是4的时候，预测出来的结果是最为准确的。