01 解决何种问题
线性回归都知道是用来描述两个变量之间的线性关系,比如身高和体重,自变量身高每增加1个单位,因变量体重就变化多少,但是现实中能用线性回归描述的情况太少了,绝大部分关系都是非线性关系,这个时候就必须用其他回归来拟合了。例如类似下图这种数据,马上会想到用多项式回归,数据拐了2个弯,可以考虑用3次项回归,
如图2,其大致反应了数据的变化趋势,但有不足的地方,多项式是基于所有数据的,即所有的数据都符合多项式规律,且常常随着次数的增加,模型的复杂度也在玄素增加。但有的数据在某个值之前成直线关系,某个值之后又是二次项或三次项关系,这种数据就不能用一种关系表示,而要把数据分开,分开拟合曲线。仔细看数据,每段都是一个明显的线性关系,在拐点的地方,数据前后趋势发生变化,可以考虑用样条回归,如图3,较好的拟合曲线。