今天我们简单谈下,多项式回归和Pipeline的应用。
之前我们了解了线性回归,线性回归的假设条件是:数据存在线性关系。并不是所有的数据具有线性关系。我们想要使用回归,可以对特征进行升维处理,转化成多项式回归。
一、多项式回归
研究一个因变量与一个或多个自变量间多项式的回归分析方法,称为多项式回归(Polynomial Regression)。多项式回归是线性回归模型的一种,其回归函数关于回归系数是线性的。其中自变量x和因变量y之间的关系被建模为n次多项式。
二、Pipeline
在使用sklearn建模时,我们可以考虑把简单的数据处理、特征处理、建模做成流水线的形式。此时用到Pipeline功能.
Pipeline就是将这些步骤都放在一起。参数传入一个列表,列表中的每个元素是管道中的一个步骤。每个元素是一个元组,元组的第一个元素是名字(字符串),第二个元素是实例化。
三、代码实现过程
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures