前言
最近在阅读论文时,有一篇论文提到了一个广义的线性回归.在介绍中,它提到了线性回归的斜率与协方差的关系. 下面简单推导一下, 加深理解.
正文
-
线性回归: 寻找一条直线 y = x β + α y=x\beta+\alpha y=xβ+α 满足数据之间的误差平方最小
( α ^ , β ^ ) = a r g m i n ( α , β ) ∑ n = 1 N ∣ ∣ y i − α − x i β ∣ ∣ 2 (\hat{\alpha},\hat{\beta})=\underset{ (\alpha,\beta)}{\rm{argmin}} \sum^{N}_{n=1}||y_i-\alpha-x_i\beta||^2 (α^,β^)=(α,β)argminn=1∑N∣∣yi−α−xiβ∣∣2 -
右边式展开以及求偏导
= ∑ n = 1 N y i 2 − ∑ n = 1 N 2 α y i − ∑ n = 1 N 2 β y i x i + ∑ n = 1 N 2 α β x i + ∑ n = 1 N β 2 x i 2 + ∑ n = 1 N α 2 = N y 2 ˉ − N 2 α y ˉ − 2 β N y x ˉ + 2 α β N x ˉ + β 2 N x 2 ˉ + N α 2 \begin{split} &=\sum^{N}_{n=1}y_i^2-\sum^N_{n=1}2\alpha y_i-\sum^N_{n=1}2\beta y_i x_i+\sum^N_{n=1}2\alpha\beta x_i+\sum^N_{n=1}\beta^2 x_i^2+\sum^N_{n=1}\alpha^2\\ &=N\bar{y^2}-N2\alpha\bar{y}-2\beta N\bar{yx}+2\alpha\beta N \bar{x}+\beta^2N\bar{x^2}+N\alpha^2 \end{split} =n=1∑Nyi2−n=1∑N2αyi−n=1∑N2βyixi+n=1∑N2αβxi+n=1∑Nβ2xi2+n=1∑Nα2=Ny2ˉ−N2αyˉ−2βNyxˉ+2αβNxˉ+β2Nx2ˉ+Nα2
对 β \beta β求偏导并令其为0有(1):
− y x ˉ + α x ˉ + β x 2 ˉ = 0 -\bar{yx}+\alpha\bar{x}+\beta\bar{x^2} = 0 −yxˉ+αxˉ+βx2ˉ=0
对 α \alpha α求偏导并令其为0有(2):
− y ˉ + β x ˉ + α = 0 -\bar{y}+\beta\bar{x}+\alpha=0 −yˉ+βxˉ+α=0
(2)代入(1)有:
β = y x ˉ − y ˉ x ˉ x 2 ˉ − x ˉ 2 \beta = \frac{\bar{yx}-\bar{y}\bar{x}}{\bar{x^2}-\bar{x}^2} β=x2ˉ−xˉ2yxˉ−yˉxˉ
α = y ˉ − β x ˉ \alpha=\bar{y}-\beta\bar{x} α=yˉ−βxˉ -
协方差公式:
C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E [ X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ] Cov(X,Y)= E[(X-E(X))(Y-E(Y))]=E[XY-XE(Y)-YE(X)+E(X)E(Y)] Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E[XY−XE(Y)−YE(X)+E(X)E(Y)]
C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] − E [ Y ] E [ X ] + E ( X ) E ( Y ) = E [ X Y ] − E [ X ] E [ Y ] Cov(X,Y)=E[XY]-E[X]E[Y]-E[Y]E[X]+E(X)E(Y)=E[XY]-E[X]E[Y] Cov(X,Y)=E[XY]−E[X]E[Y]−E[Y]E[X]+E(X)E(Y)=E[XY]−E[X]E[Y] -
代入 β \beta β式中
β = C o v ( X , Y ) V a r ( x ) \beta = \frac{Cov(X,Y)}{Var(x)} β=Var(x)Cov(X,Y)