算法进阶--第二天
线性回归
- 最小二乘理解过程:
如对房价的预测:
Living area( f e e t 2 feet^2 feet2) | bedrooms | Price(1000$/s) |
---|---|---|
2104 | 3 | 400 |
1600 | 3 | 330 |
… | … | … |
… | … | … |
此时通过对面积与卧室个数可以建立一个线性回归来对房价进行预测,预测值为 h θ ( x ) h_\theta(x) hθ(x):
如:
h θ ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 h_\theta(x)=\theta_0+\theta_1{x_1}+\theta_2{x_2} hθ(x)=θ0+θ1x1+θ2x2
如果有n个特征,则转换为:(将 θ \theta θ和特征 x x x是行向量的)
h θ ( x ) = ∑ i = 0 n θ i x i = θ T x h_\theta(x)=\sum_{i=0}^{n}\theta_ix_i=\theta^{T}x hθ(x)=i=0∑nθixi=θTx
同时也有:(真实房价 y y y=预测房价 θ T x \theta^{T}x θTx+误差 ϵ i \epsilon_i ϵi)
y = θ T x + ϵ i y=\theta^{T}x+\epsilon_i y=θTx+ϵi
假设样本之间都是独立的,则误差 ϵ i \epsilon_i ϵi也是独立同分布的,
则根据中心极限定理,误差 ϵ i \epsilon_i ϵi服从高斯分布(正太分布),则:
ϵ i ~ N ( 0 , σ 2 ) \epsilon_i~N(0,\sigma^2) ϵi~N(0,σ2)(均值为0,方差为某定值 σ 2 \sigma^2 σ2)
则 ϵ i \epsilon_i ϵi的概率密度函数为:
p ( ϵ i ) = 1 2 π σ e x p ( − ϵ i 2 2 σ 2 ) p(\epsilon_i)=\frac{1}{\sqrt{2\pi\sigma}}exp(-\frac{
{\epsilon_i}^2}{2\sigma{^2}}) p(ϵi)=2πσ1exp(−2σ2ϵi2)
根据式1.1:
p ( y i ∣ x i ; θ ) = 1 2 π σ e x p ( − ( y i − θ T x i ) 2 2 σ 2 ) p(y_i|x_i;\theta)=\frac{1}{\sqrt{2\pi\sigma}}exp(-\frac{(y_i-\theta{^T}x_i)^2}{
{2\sigma{^2}}}) p(yi∣xi;θ)=2πσ1exp(−2σ2(yi−θTxi)2)
则有:(因样本之间是iid,则 p ( y 1 , y 2 . . . y m ) p(y_1,y_2...y_m) p(y1,y2...ym)的联合概率分布为: L ( θ ) L(\theta) L(θ)):
L ( θ ) = ∏ i = 1 m ( y i ∣ x i ; θ ) = ∏ i = 1 m 1 2 π σ e x p ( − ( y i − θ T x i ) 2 2 σ 2 ) L(\theta)=\prod_{i=1}^{m}{(y_i|x_i;\theta)}=\prod_{i=1}^m{\frac{1}{\sqrt{2\pi\sigma}}exp(-\frac{(y_i-\theta{^T}x_i)^2}{
{2\sigma{^2}}})} L(θ)