机器学习总结三之线性回归
线性回归定义
线性回归:利用线性回归方程的最小二乘函数对一个或者多个自变量和因变量之间关心进行建模的方法
线性回归数学定义:
数据
(
Y
i
,
X
i
1
,
.
.
.
,
X
i
p
)
,
i
=
1
,
.
.
.
n
(Y_{i},X_{i1},...,X_{ip}), i=1,...n
(Yi,Xi1,...,Xip),i=1,...n
模型
Y
=
X
β
+
ϵ
Y=X\beta+\epsilon
Y=Xβ+ϵ
解析解
β
^
=
(
X
T
X
)
−
1
X
T
Y
\hat{\beta}=(X^{T}X)^{-1}X^{T}Y
β^=(XTX)−1XTY
上式中:
Y
为
包
括
了
观
测
值
的
列
向
量
Y
1
,
.
.
.
,
Y
n
。
Y为 包括了观测值的列向量 Y_{1}, ...,Y_{n} 。
Y为包括了观测值的列向量Y1,...,Yn。
β
为
包
括
了
参
数
值
的
列
向
量
。
\beta 为包括了参数值的列向量。
β为包括了参数值的列向量。
X
=
(
1
x
11
.
.
.
x
1
p
1
x
21
.
.
.
x
2
p
.
.
.
.
.
.
.
.
.
1
x
n
1
.
.
.
x
n
p
)
X=\begin{pmatrix} 1 & x_{11}& .& .& .&x_{1p} \\ 1& x_{21}& .& . & . & x_{2p}\\ .& .& .& & & \\ .& .& & .& & \\ .& .& & & .& \\ 1& x_{n1}&. &. &. &x_{np} \end{pmatrix}
X=⎝⎜⎜⎜⎜⎜⎜⎛11...1x11x21...xn1............x1px2pxnp⎠⎟⎟⎟⎟⎟⎟⎞
X
T
X
不
可
逆
的
时
候
可
以
采
取
的
对
策
:
X^{T}X 不可逆的时候可以采取的对策:
XTX不可逆的时候可以采取的对策:
- 使用伪逆代替其逆矩阵,Python:numpy.linalg.pinv()
- 去掉冗余特征(线性相关的特征)
- 减少特征使得特征p<=n
示例
详见机器学习总结一