文章目录
线性回归(简单线性回归)
简单线性回归模型是用于估计一个连续预测变量和一个连续回应变量的线性关系。回归方程或估计回归方程表达为:
f ( x ) = w x + b f(x)=wx+b f(x)=wx+b
- x是预测变量
- f(x)是回应变量的预测值
- b是回归线在y轴上的截距
- w是回归线的斜率
- b和w称为回归系数
问题:只要能求出 w w w和 b b b,便能得到线性模型,该如何求得 w w w和 b b b呢?
我们希望预测值 f ( x i ) f(x_{i}) f(xi)和真实值 y i y_{i} yi尽可能接近,该如何衡量它们的差异呢?
直观来说,我们可以有两种方案:
1 ) ∣ f ( x i ) − y i ∣ 1) |f(x_{i})-y_{i}| 1)∣f(xi)−yi∣
2 ) ( f ( x i ) − y i ) 2 2)(f(x_{i})-y_{i})^{2} 2)(f(xi)−yi)2
第二个方案即最小二乘法法(least square method)。我们把所有个体的预测值和真实值之间的差异加总:
g ( w , b ) = ∑ i = 1 n ( f ( x i ) − y i ) 2 = ∑ i = 1 n ( w x i + b − y i ) 2 g(w,b)=\sum_{i=1}^{n}(f(x_{i})-y_{i})^{2}=\sum_{i=1}^{n}(wx_{i}+b-y_{i})^{2} g(w,b)=∑i=1n(f(xi)−yi)