17向线性回归的转换
标签:机器学习与数据挖掘
1.获得线性变换
比如,有些变量的关系就不是线性关系,如果用线性回归的话,就会出问题。比如以下的情况:
可以进行对数表换之后,才好进行熟悉的线性回归。当然,我们这里介绍的是其中一种方法。那就是Frederick、Mosteller和Tukey在他们出版的Data Analysis and Regression一书中建议采用“凸规则”发现获得线性性状的转换方法。
观察”x down, y down“的第三象限,与上个点图有相同的曲线形状。对我们的曲线来说,来自凸规则的启发式规则是“xdown,ydown”。这意味着我们将转换变量x,方法是将x在梯度上的位置降低1个或多个点。对y也采用同样的方法。所有未转换变量的当前位置为1。凸规则建议我们对字母块的频率和点值,要么运用平方根进行转换,要么运用自然对数进行转换,这样就可能会得到两个变量之间存在的线性关系。