(一)简单线性回归
总体回归直线: Y=β0+β1X+ϵ , ϵ 称为误差,服从零均值的正态分布,一般观察不到,其中 Var(ϵ)=σ2 , E(ϵ)=0
通常假设误差 ϵ 是独立于X的。
- 探索总体变量
最小二乘线是用样本估计总体的一个特征。
例如:有n个关于Y的观测值,记为 y1,y2,...,yn ,可用它们估计总体均值 μ 。一般来说,样本均值能提供对总体均值的良好估计。如果我们能够从大量观测数据集中得到许多对 μ 的估计,则它们的均值正好等于 μ 。
- 那么单一的估计值 μ^ 偏离真值 μ 有多远?
用 μ^ 的标准误差(standard error,记作 SE(μ^) )来衡量。
Var(μ^)=SE(μ^)2=σ2n