模式识别学习笔记-数学知识

数学期望(均值)和方差

随机变量X的数学期望(或称均值)记作 E ( x ) E(x) E(x),它描述了随机变量的取值中心,随机变量 ( X − E ( X ) ) 2 (X-E(X))^2 (XE(X))2的数学期望称为 X X X的方差,记作 σ 2 \sigma^2 σ2,而 σ \sigma σ称为 X X X的均方差(标准差)。它描述了随机变量与均值的偏差的疏密程度。

  • X X X是连续型随机变量,其分布密度为 p ( x ) p(x) p(x),则当积分绝对收敛的时候

m = E ( X ) = ∫ − ∞ ∞ x p ( x ) d x σ 2 = E { ( X − m ) 2 } = ∫ − ∞ ∞ ( x − m ) 2 p ( x ) d x m = E(X)=\int_{-\infty}^{\infty}xp(x)dx \\ \sigma^2 = E\{(X-m)^2\} = \int_{-\infty}^{\infty}(x-m)^2p(x)dx m=E(X)=xp(x)dxσ2=E{(Xm)2}=(xm)2p(x)dx

  • X X X是离散型随机变量,其可能取值为 x k , k = 1 , 2 , . . . , x_k,k=1,2,..., xk,k=1,2,..., P ( X = x k ) = p k P(X=x_k)=p_k P(X=xk)=pk,则(当级数是绝对收敛时)
    m = E ( X ) = ∑ k = 1 ∞ x k p k D ( X ) = ∑ k = 1 ∞ ( x k − m ) 2 p k m = E(X)=\sum^{\infty}_{k=1}x_kp_k \\ D(X) = \sum^{\infty}_{k=1}(x_k-m)^2p_k m=E(X)=k=1xkpkD(X)=k=1(xkm)2pk

协方差矩阵

协方差矩阵说明随机向量 X X X的各分量的分散情况,定义为:
c = E { ( X − m ) ( X − m ) T } = E { [ ( X 1 − m 1 ) ⋮ ( X 1 − m 1 ) ] [ ( X 1 − m 1 ) ⋯ ( X n − m n ) ] } = [ E [ ( X 1 − m 1 ) ( X 1 − m 1 ) ] ⋯ E [ ( X 1 − m 1 ) ( X n − m n ) ] ⋮ ⋱ ⋮ E [ ( X n − m n ) ( X 1 − m 1 ) ] ⋯ E [ ( X n − m n ) ( X n − m n ) ] ] = ( λ 11 ⋯ λ 1 n ⋮ ⋱ ⋮ λ n 1 ⋯ λ n n ) \begin{aligned} c &= E\{(X-m)(X-m)^T\} \\ &= E\left\{ \left[ \begin{matrix} (X_1-m_1) \\ \vdots \\ (X_1-m_1) \end{matrix} \right] \left[ \begin{matrix} (X_1-m_1)\cdots(X_n-m_n) \end{matrix} \right] \right\}\\ &= \left[ \begin{matrix} E[(X_1-m_1)(X_1-m_1)]\cdots E[(X_1-m_1)(X_n-m_n)] \\ \vdots \ddots \vdots \\ E[(X_n-m_n)(X_1-m_1)]\cdots E[(X_n-m_n)(X_n-m_n)] \end{matrix} \right] \\ &= \left( \begin{matrix} \lambda_{11} \cdots \lambda_{1n} \\ \vdots \ddots \vdots \\ \lambda_{n1} \cdots \lambda_{nn} \end{matrix} \right) \end{aligned} c=E{(Xm)(Xm)T}=E (X1m1)(X1m1) [(X1m1)(Xnmn)] = E[(X1m1)(X1m1)]E[(X1m1)(Xnmn)]E[(Xnmn)(X1m1)]E[(Xnmn)(Xnmn)] = λ11λ1nλn1λnn
其中,协方差矩阵的各分量为:
λ i j = E [ ( X i − m i ) ( X j − m j ) ] \lambda_{ij} = E[(X_i-m_i)(X_j-m_j)] λij=E[(Ximi)(Xjmj)]
i ≠ j i \neq j i=j,则 λ i j \lambda_{ij} λij X X X的第 i i i个分量与第 j j j个分量的协方差;
i = j i = j i=j,则 λ i j \lambda_{ij} λij是随机变量 X i X_i Xi的方差,即协方差矩阵的对角分量;

一维正态密度函数

一维随机变量 X X X的正态密度函数表示为:
p ( x ) = 1 2 π σ e x p [ − ( x − m ) 2 2 σ 2 ] p(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{(x-m)^2}{2\sigma^2}\right] p(x)=2π σ1exp[2σ2(xm)2]
其中均值 m = E ( X ) = ∫ − ∞ ∞ x p ( x ) d x m=E(X)=\int_{-\infty}^{\infty}xp(x)dx m=E(X)=xp(x)dx;方差 σ 2 = E { ( X − m ) 2 } = ∫ − ∞ ∞ ( x − m ) 2 p ( x ) d x \sigma^2=E\{(X-m)^2\}=\int_{-\infty}^{\infty}(x-m)^2p(x)dx σ2=E{(Xm)2}=(xm)2p(x)dx σ \sigma σ为标准差。
m m m左右各为 k σ k\sigma 的范围内,概率为:
p { m − k σ ≤ x ≤ m + k σ } = ∫ m − k σ m + k σ 1 2 π σ e x p [ − 1 2 ( x − m σ ) 2 ] d x = 1 2 π ∫ − k k e x p [ − y 2 2 ] d y \begin{aligned} p\{m-k\sigma\leq x\leq m+k\sigma\} &= \int_{m-k\sigma}^{m+k\sigma}\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{1}{2}\left(\frac{x-m}{\sigma}\right)^2\right]dx \\ &= \frac{1}{\sqrt{2\pi}}\int_{-k}^k exp\left[-\frac{y^2}{2}\right]dy \end{aligned} p{mxm+}=mm+2π σ1exp[21(σxm)2]dx=2π 1kkexp[2y2]dy
其中, y = ( x − m ) / σ y=(x-m)/\sigma y=(xm)/σ,此时 p p p k k k的关系:
p { m − k σ ≤ x ≤ m + k σ } = { 0.683 k = 1 0.954 k = 2 0.997 k = 3 p\{m-k\sigma \leq x \leq m + k\sigma\}= \begin{cases} 0.683 & k = 1 \\ 0.954 & k = 2 \\ 0.997 & k = 3 \end{cases} p{mxm+}= 0.6830.9540.997k=1k=2k=3
因此,在区间 ∣ x − m ∣ ≤ 3 σ |x-m|\leq 3\sigma xm3σ内,差不多包含了全部由正态样本取样的子样本。
正态密度函数可完全由均值和方差所决定,因此可以由下式表示:
p ( x ) ∼ N ( m , σ 2 ) p(x)\sim N(m,\sigma^2) p(x)N(m,σ2)

多维正态密度函数

n n n维随机向量的正态密度函数表示为:
p ( x ) = 1 ( 2 π ) n 2 ∣ C ∣ 1 2 e x p { − 1 2 ( x − m ) T C − 1 ( x − m ) } p(x)=\frac{1}{(\sqrt{2\pi})^{\frac{n}{2}}|C|^\frac{1}{2}}exp\left\{-\frac{1}{2}(x-m)^TC^{-1}(x-m)\right\} p(x)=(2π )2nC211exp{21(xm)TC1(xm)}
其中
x = [ x 1 ⋮ x n ] , m = [ m 1 ⋮ m n ] , C = [ σ 11 2 ⋯ σ 1 n 2 ⋮ ⋱ ⋮ σ n 1 2 ⋯ σ n n 2 ] x= \left[ \begin{matrix} x_1 \\ \vdots \\ x_n \end{matrix} \right], m= \left[ \begin{matrix} m_1 \\ \vdots \\ m_n \end{matrix} \right], C= \left[ \begin{matrix} \sigma_{11}^2 & \cdots & \sigma_{1n}^2 \\ \vdots & \ddots & \vdots \\ \sigma_{n1}^2 & \cdots & \sigma_{nn}^2 \end{matrix} \right] x= x1xn ,m= m1mn ,C= σ112σn12σ1n2σnn2
∣ C ∣ |C| C为协方差矩阵 C C C的行列式。
多维正态密度函数由其均值 m m m和协方差矩阵 C C C确定,因此可用下式表示:
p ( x ) ∼ N ( m , C ) p(x) \sim N(m, C) p(x)N(m,C)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值