数据学习(四)-概率与概率分布

1.事件及其概率

2.离散型概率分布

3.连续型概率分布

4. 知识点小结

1. 事件及其概率

具体如下:

1.1 试验与其概率

概率:是对某一特定事件出现可能性大小的一种数值度量。

试验:对一个或多个试验对象进行一次观察或测量的过程。试验的结果为事件。

不能被分解成其他事件组合的基本事件成为简单事件
在一定条件下,一定发生的事件称为必然事件,用符号在这里插入图片描述表示;在一定条件下,一定不会发生的事件成为不可能事件,用在这里插入图片描述表示。
事件A发生的概率是一个介于0-1的值,用以度量试验完成事件A的发生的可能性大小,记作P(A)。计算公式如下:
在这里插入图片描述
1.2 概率的性质和运算法则

在试验中,两个事件有一个发生时,另一个就不可能发生,称这两个事件为互斥事件
例题如下:
在这里插入图片描述
事件A和事件B同时发生的事件,称为A与B的交,记为A*B,或简记为AB。

已知事件B发生的条件下,事件A发生的概率,称为已知B时A的条件概率,或称为给定B下A的概率,记为P(A|B).
条件概率的计算公式如下:
在这里插入图片描述
在讨论条件概率时,我们把A和B的交的概率P(AB)称为联合概率。而单个事件的发生概率P(A),P(B)称为边际概率

独立事件
在特定试验中,他们互不影响,事件A的概率不会因为事件B的发生而有所改变,我们把具有如此特征放入事件A和事件B称为独立事件。
则这两个事件同时发生的概率就等于他们各自发生的概率之积。

1.3 全概率与逆概率公式
全概率公式
条件概率和乘法公式对于概率理论及其应用中的真正意义在于,他们能将相对复杂的一个事件分解成相对简单的便于计算概率的多个事件,而全概率公式正是这一思路的一般实现。全概率公式如下:
在这里插入图片描述
逆概率公式
在概率中,由全概率公式可以推得另一个著名公式即逆概率公式,也称为贝叶斯公式。公式如下:
在这里插入图片描述

2. 离散型概率及其分布

2.1 随机变量及其概率分布
某次试验结果的数值描述,称为随即变量。
只能取有限个或可数个的随机变量,称为离散型随机变量;可以取一个或多个区间中任何值得随机变量,称为连续型随机变量。
列出随机变量X的所有可能取值x1,x2,…,以及取每个值得概率p1,p2,…,并用表格的形式表现出来,称为离散型随机变量的概率分布。
方差
离散型随机变量X的方差等于(xi-u)2与其相应的概率pi的乘积之和,用在这里插入图片描述或D(x)表示,即
在这里插入图片描述随机变量X的标准差等于其方差的算术平方根。

2.2 几种概率分布
两点分布

最简单的随机试验是只有两种可能结果的试验,称为伯努利试验。
如果随机变量X只可能取0和1两个值,他们的概率分布为P(X=1)=p,P(X=0)=1-p=q,或
P(X=x)=pxq1-x(0<p<1)
则称X服从参数为p的两点分布,也称为0-1分布。

二项分布
若将伯努利试验独立地重复n次,n是一固定数值,则该试验称为n重伯努利试验。
在n次试验中,出现“成功”的次数的概率为:
在这里插入图片描述
则称随机变量X服从参数为(n,p)的二项分布,记作X~B(n,p)。
二项分布的数学期望和方差分别为
u=E(X)=np,s2=D(x)=npq
泊松分布

泊松试验,具有两个重要特征:
(1)所考察的事件在任意两个长度相等的区间里发生一次的机会均等;
(2)所考察的事件在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即是独立的。
如果随机变量X的概率分布为:
则称X服从参数y的泊松分布,记作X~P(y)。

超几何分布
如果随机变量X的概率分布为:
在这里插入图片描述
其中l=min(M,n),n为试验次数,N为总体中元素的个数,M为总体中代表成功的元素的个数,则称X服从参数为n,N,M的超几何分布,记作X~H(n,N,M)。

3.连续型概率分布

3.1 概率密度
设X是一连续型随即变量,他代表某一区间或多个区间中的任意数值,它的概率分布通过概率密度函数来表述,记作f(x)。
对于随机变量X,设x为任意实数,则函数F(x)=P(X<=x),则称为随即变量X的分布函数。

正态分布
如果随机变量X的概率密度函数为:
在这里插入图片描述
其中u是随机变量X的均值,他可为任意实数,o2是随机变量X的方差,且o>0,pi=3.1415926,e=2.71828,则称X为正态随机变量,或称X服从参数为u,o2的正态分布,记作X~N(u,o2)。

标准正态分布
如果正态分布的随机变量具有均值为0,标准差为1,则称该随机变量服从标准正态分布,记为N(0,1)。标准正态分布的概率密度函数用g(x),即
在这里插入图片描述
有了标准正态分布后,就可以将任何一个服从一般正态分布的随机变量X~N(u,o2)转换成标准正态分布N(0,1),转换公式为:
在这里插入图片描述
3.2 其他概率分布
均匀分布
对于只在区间[a,b]内取值的随机变量,其概率分布常用均匀分布来描述。
如果随机变量X具有如下的概率密度函数:
在这里插入图片描述
则称X服从区间[a,b]上的均匀分布,记作X~U[a,b]。

指数分布
指数分布式用于描述等待某一特定事件发生所需时间的一种连续型概率分布。
如果随机变量X具有如下的概率密度函数:
在这里插入图片描述
则称X服从参数为y的指数分布,记作X~E(y)。概率论证明,该类随机变量去小于或等于某一特定值x的概率是:
在这里插入图片描述

4. 知识点小结

1 试验是进行一次测试额过程,事件是试验的结果
2 样本空间是一次试验中,所有可能结果的几何。
3 概率是一次事件发生的可能性,而频率是该事件发生的结果次数占总频数的比率
4 互斥事件是两个事件相互独立,不可能一起发生的事件。加法法则是直接事件的概率值进行加权。
5 条件概率是在事件B发生的条件下,事件A发生的概率。
6 两个事件独立意味着两个事件相互不影响,一个事件的发生不影响另一个的事件发生。
7 只有两个可能结果的试验称为伯努利试验。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值