线性回归就是假设特征满足线性关系,根据已经获得一些数据来训练一个模型,并用这个模型进行预测。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
模型给出了我们要学习的函数形式。
h
w
(
x
i
)
=
w
0
+
w
1
x
1
+
w
2
x
2
+
.
.
.
+
w
n
x
n
=
W
T
X
h_w(x^i) = w_0 + w_1x_1 + w_2x_2 + ... + w_nx_n = W^TX
hw(xi)=w0+w1x1+w2x2+...+wnxn=WTX
(1)均方误差MSE
(2)平均绝对误差MAE
损失函数为
J
(
W
)
=
1
2
M
∑
i
=
1
M
(
h
w
(
x
i
)
−
y
i
)
2
=
1
2
M
(
X
W
−
Y
)
T
(
X
W
−
Y
)
J(W) = \frac{1}{2M}\sum_{i=1}^{M}(h_w(x^i) - y^i)^2 = \frac{1}{2M}(XW - Y)^T(XW - Y)
J(W)=2M1∑i=1M(hw(xi)−yi)2=2M1(XW−Y)T(XW−Y)
若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。
卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。
卡方分布的概率密度函数为:
从分布图可以看出:分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。