数据分析(1)--概率论基础


随机变量的分布及数字特征


1.常见分布

   ------二项分布

   

   ------泊松分布

  

   ------概率密度函数

 若对于随机变量X的分布函数,存在非负函数f(x),使得对于任意实数X有:


其中f(x)称为X的概率密度函数。


   ------指数分布


  ---------正态分布,也称作高斯分布



2.随机变量的数字特征

   --------数学期望

   

   ----------方差


    ----------协方差



    ----------相关系数

  

   ------------期望的性质

   E(cX)=cE(X)


    ------------方差的性质

  D(cX)=c^2D(X)

3 随机向量

   -------联合分布

     1.联合分布

     X=(X1,X2,....Xp)是p维随机变量,则称

为X的联合分布函数。

   ----------随机向量X的均值向量

     1.随机向量X的均值向量

      若E(Xi)=Ui存在,则称

   

     为随机向量X的均值向量

      2.随机向量X的协方差阵

若Xi和Xj的协方差Cov(Xi,Xj)存在(i,j=1,2,....p),则称


为随机向量X的协方差阵。

       3.随机向量X和Y的协方差阵

      若Xi和Yj的协方差Cov(Xi,Yj)存在(i=1,,,p;j=1,....,q),则称


为随机向量X和Y的协方差阵,若

      COV(X,Y)=O  (其中O表示零矩阵)

则称X与Y不相关。

4.中心极限定理

    概率论中讨论随机变量和的分布以正态分布极限的一组定理,指出了大量随机变量之和近似服从正态分布的条件。

设随机变量X1, X2,...,Xn独立同分布, 且具有有限的数学期望方差E(Xi) = µD(Xi) = σ² ≠ 0 (i=1,2,...n)。记

\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i}\zeta_n=\frac{\bar{X} -\mu}{\sigma/\sqrt{n}},则 \lim_{n\rightarrow\infty}P\left(  \zeta_n\leqz\right)  =\Phi\left(  z\right)

其中Φ(z)是标准正态分布的分布函数。

5.大数定律

指数量越多,则其结果就越趋近正态分布,发生误差机率与数值也会越小。

人们发现,在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;人们同时也发现,在对物理量的测量实践中,测定值的算术平均也具有稳定性。





  

      


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值