在上一节中我们介绍了线性回归的原理,然后分别用python和sklearn实现了不同变量个数的线性回归的几个例子。线性回归模型形式简单,有很好的可解释性,但是它只适用于X和y之间存在线性关系的数据集。对于非线性关系的数据集,线性回归不能很好的工作。因此本文介绍线性回归模型的扩展——「多项式回归」,我们可以用它来拟合非线性关系的数据集。
假设我们有一个单变量数据集,如下图。
为了观察它们之间的关系,我们用 matplotlib 画出散点图。
从图中看,它们有点像在一条直线上,但仔细看更像是在一个抛物线上。
首先我们假设它们满足线性关系,使用线性回归模型得到的结果如下图中黄线所示。