基本形式
给定包含条记录的数据集:
线性回归模型试图学习一个线性模型以尽可能地预测因变量:
参数估计
将线性表达式写为向量形式:
利用最小二乘法令均方误差最小化:
注:当线性回归模型存在多重共线性问题时,可能会有多组解使得均方误差最小化,常见的解决方法是引入正则化。
线性回归模型的变形
1.对数线性回归
对数线性回归本质上仍然是线性回归模型,只是我们将因变量的对数作为模型新的因变量:
2.广义线性模型
当数据集不适合用传统的多元线性回归方法拟合时,我们可以考虑对因变量做一些合理的变换。最常用的就是对数线性回归,还有很多其他的变换统称为“广义线性模型”generalized linear model
:
其中是单调可微函数。