机器学习——数理统计和参数估计相关概念知识总结

引言

为了系统地复习机器学习相关算法及基础知识,对学过的知识进行一定的整理。

正文

事件的独立性(Independence)

定义:如果事件A和事件B满足 P ( A B ) = P ( A ) P ( B ) P(A B)=P(A) P(B) P(AB)=P(A)P(B),则称事件A和事件B独立。举个例子:如果一个人语文考试通过为事件A,数学考试通过为事件B,这两个考试一点关系都没有,互不影响,所以这个人同时通过两科考试的概率就应该等于通过语文考试的概率乘以通过数学考试的概率。

既然A、B是独立的,那么就有 P ( A ∣ B ) = P ( A ) P(A | B)=P(A) P(AB)=P(A)。过了数学考试,语文考试就稳了吗?不存在的,没有半毛钱关系。

期望(Expectation)

期望就是概率加权平均值,不多扯了,上公式。
离散型: E ( X ) = ∑ i x i p i E(X)=\sum_{i} x_{i} p_{i} E(X)=ixipi
连续型: E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int_{-\infty}^{\infty} x f(x) d x E(X)=xf(x)dx
对于编程来说,上述两个公式并无差异,在编程时,同样需要对连续的函数离散化。

对于期望,下面两个公式无条件成立
E ( k X ) = k E ( X ) E(k X)=k E(X) E(kX)=kE(X)
E ( X + Y ) = E ( X ) + E ( Y ) E(X+Y)=E(X)+E(Y) E(X+Y)=E(X)+E(Y)

如果X,Y独立的话,则有 E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E(X) E(Y) E(XY)=E(X)E(Y),但是从 E ( X Y ) = E ( X ) E ( Y ) E(X Y)=E(X) E(Y) E(XY)=E(X)E(Y),无法得出A,B独立,只能得到X,Y不相关。独立和不相关的区别,下面会说到。

方差(Varience)

定义: Var ⁡ ( X ) = E { [ X − E ( X ) ] 2 } = E ( X 2 ) − E 2 ( X ) \operatorname{Var}(X)=E\left\{[X-E(X)]^{2}\right\}=E\left(X^{2}\right)-E^{2}(X) Var(X)=E{ [XE(X)]2}=E(X2)E2(X),反应数据的波动情况。
由于 Var ⁡ ( X ) ≥ 0 \operatorname{Var}(X) \geq 0 Var(X)0,可以得到 E ( X 2 ) ≥ E 2 ( X ) E\left(X^{2}\right) \geq E^{2}(X) E(X2)E2(X)

对于方差,下述公式无条件成立:
Var ⁡ ( c ) = 0 \operatorname{Var}(c)=0 Var(c)=0
Var ⁡ ( X + c ) = Var ⁡ ( X ) \operatorname{Var}(X+c)=\operatorname{Var}(X) Var(X+c)=Var(X)
Var ⁡ ( k X ) = k 2 Var ⁡ ( X ) \operatorname{Var}(k X)=k^{2} \operatorname{Var}(X) Var(kX)=k2Var(X)
若X,Y独立,则有
Var ⁡ ( X + Y ) = Var ⁡ ( X ) + Var ⁡ ( Y ) \operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y) Var(X+Y)=Var(X)+Var(Y)

协方差(Covarience)

定义: Cov ⁡ ( X , Y ) = E { [ X − E ( X ) ] [ Y − E ( Y ) ] } \operatorname{Cov}(X, Y)=E\{[X-E(X)][Y-E(Y)]\} Cov(X,Y)=E{ [XE(X)][YE(Y)]}
性质:
Cov ⁡ ( X , Y ) = Cov ⁡ ( Y , X ) \operatorname{Cov}(X, Y)=\operatorname{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)
Cov ⁡ ( a X + b , c Y + d ) = acCov ⁡ ( X , Y ) \operatorname{Cov}(a X+b, c Y+d)=\operatorname{acCov}(X, Y) Cov(aX+b,cY+d)=acCov(X,Y)
Cov ⁡ ( X 1 + X 2 , Y ) = Cov ⁡ ( X 1 , Y ) + Cov ⁡ ( X 2 , Y ) \operatorname{Cov}\left(X_{1}+X_{2}, Y\right)=\operatorname{Cov}\left(X_{1}, Y\right)+\operatorname{Cov}\left(X_{2}, Y\right) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
Cov ⁡ ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) \operatorname{Cov}(X, Y)=E(X Y)-E(X) E(Y) Cov(X,Y)=E(XY)E(X)E(Y)

特殊的, 当 Cov ⁡ ( X , Y ) = 0 \operatorname{Cov}(X, Y)=0 Cov(X,Y)=0,则说明X,Y不相关(线性不相关)。
Cov ⁡ ( X , Y ) > 0 \operatorname{Cov}(X, Y)>0 Cov(X,Y)>0,则说明X,Y趋势相同。
Cov ⁡ ( X , Y ) < 0 \operatorname{Cov}(X, Y)<0 Cov(X,Y)<0,则说明X,Y趋势相反。

协方差的上界定理:
Var ⁡ ( X ) = σ 1 2 , Var ⁡ ( Y ) = σ 2 2 \operatorname{Var}(X)=\sigma_{1}^{2} ,\operatorname{Var}(Y)=\sigma_{2}^{2} Var(X)=σ12Var(Y)=σ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值