数学小抄:线性回归与协方差

前言

最近在阅读论文时,有一篇论文提到了一个广义的线性回归.在介绍中,它提到了线性回归的斜率与协方差的关系. 下面简单推导一下, 加深理解.

正文
  1. 线性回归: 寻找一条直线 y = x β + α y=x\beta+\alpha y=xβ+α 满足数据之间的误差平方最小
    ( α ^ , β ^ ) = a r g m i n ( α , β ) ∑ n = 1 N ∣ ∣ y i − α − x i β ∣ ∣ 2 (\hat{\alpha},\hat{\beta})=\underset{ (\alpha,\beta)}{\rm{argmin}} \sum^{N}_{n=1}||y_i-\alpha-x_i\beta||^2 (α^,β^)=(α,β)argminn=1N∣∣yiαxiβ2

  2. 右边式展开以及求偏导
    = ∑ n = 1 N y i 2 − ∑ n = 1 N 2 α y i − ∑ n = 1 N 2 β y i x i + ∑ n = 1 N 2 α β x i + ∑ n = 1 N β 2 x i 2 + ∑ n = 1 N α 2 = N y 2 ˉ − N 2 α y ˉ − 2 β N y x ˉ + 2 α β N x ˉ + β 2 N x 2 ˉ + N α 2 \begin{split} &=\sum^{N}_{n=1}y_i^2-\sum^N_{n=1}2\alpha y_i-\sum^N_{n=1}2\beta y_i x_i+\sum^N_{n=1}2\alpha\beta x_i+\sum^N_{n=1}\beta^2 x_i^2+\sum^N_{n=1}\alpha^2\\ &=N\bar{y^2}-N2\alpha\bar{y}-2\beta N\bar{yx}+2\alpha\beta N \bar{x}+\beta^2N\bar{x^2}+N\alpha^2 \end{split} =n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2ˉN2αyˉ2βNyxˉ+2αβNxˉ+β2Nx2ˉ+Nα2
    β \beta β求偏导并令其为0有(1):
    − y x ˉ + α x ˉ + β x 2 ˉ = 0 -\bar{yx}+\alpha\bar{x}+\beta\bar{x^2} = 0 yxˉ+αxˉ+βx2ˉ=0
    α \alpha α求偏导并令其为0有(2):
    − y ˉ + β x ˉ + α = 0 -\bar{y}+\beta\bar{x}+\alpha=0 yˉ+βxˉ+α=0
    (2)代入(1)有:
    β = y x ˉ − y ˉ x ˉ x 2 ˉ − x ˉ 2 \beta = \frac{\bar{yx}-\bar{y}\bar{x}}{\bar{x^2}-\bar{x}^2} β=x2ˉxˉ2yxˉyˉxˉ
    α = y ˉ − β x ˉ \alpha=\bar{y}-\beta\bar{x} α=yˉβxˉ

  3. 协方差公式:
    C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E [ X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ] Cov(X,Y)= E[(X-E(X))(Y-E(Y))]=E[XY-XE(Y)-YE(X)+E(X)E(Y)] Cov(X,Y)=E[(XE(X))(YE(Y))]=E[XYXE(Y)YE(X)+E(X)E(Y)]
    C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] − E [ Y ] E [ X ] + E ( X ) E ( Y ) = E [ X Y ] − E [ X ] E [ Y ] Cov(X,Y)=E[XY]-E[X]E[Y]-E[Y]E[X]+E(X)E(Y)=E[XY]-E[X]E[Y] Cov(X,Y)=E[XY]E[X]E[Y]E[Y]E[X]+E(X)E(Y)=E[XY]E[X]E[Y]

  4. 代入 β \beta β式中

    β = C o v ( X , Y ) V a r ( x ) \beta = \frac{Cov(X,Y)}{Var(x)} β=Var(x)Cov(X,Y)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值