线性回归基本形式:
其中a的上标表示样本编号,下标表示特征编号。
基本假设:
(1)样本是非随机产生的。即样本本身是存在一定规律的。
(2)等方差及不相关的假定:
线性模型拟合后的值与真实值之间的差异叫做
残差,假设残差的期望为零,且各个样本的残差不相关。
在这个假设下,回归系数的最小二乘估计是回归系数的最小方差线性无偏估计。
(3) 残差独立且都服从标准正态分布
在这个假设下,样本数据产生的误差将是标准正态分布方差的最小方差无偏估计,并且可以进行显著性检验和区间估计。