常见离散型概率分布
1、 二项分布
伯努利实验:
(1)实验只能有两种结果,be or not to be
(2)实验互相独立的,且可重复进行n次
(3)每次实验互不影响
二项分布:
在n次伯努利实验中,单次实验发生概率为p的结果发生的次数
2、泊松分布
泊松分布描述的是一定时间段或空间区域或其它单位内某个事件发生的次数。
3、超几何分布
泊松分布对应的场景是有放回抽样,超几何分布描述的场景则是不放回抽样。
常见连续性概率分布
1、正态分布
2、均匀分布
3、卡方分布
……
$ python实现(下附代码)
注意:
1、本次使用Anaconda环境运行python,运行系统为windows10
2、因为matplot版本的原因,在使用destiny的地方如果有报错的话,可以改为normed
-----part.01-----
#用python实现样本集设置、计算PDF/PMF
import numpy
#用numpy生成样本量为100,n为10,p为0.5的二项分布样本集
s1 = numpy.random.binomial(n=10, p=0.5, size=100)
s1
#用numpy生成样本量为100,p为0.5的泊松分布样本集
s2 = numpy.random.poisson(lam=1, size=100)
s2
#用numpy生成样本量为100,U(0,1)的均匀分布样本集,左闭右开
s3 = numpy.random.uniform(low=0, high=1, size=100)
s3
#用numpy生成样本量为100,N(0,1)的正态分布样本集
#使用normal函数自定义均值、样本差
s41 = numpy.random.normal(loc=0, scale=1, size=100)
#使用standard_normal函数
s42 = numpy.random.standard_normal(size=100)
print(s41)
print(s42)
#生成样本量为100的,符合E(1/2)指数分布的样本集,指令内参数为指数分布参数λ的倒数
s5 = numpy.random.exponential(scale=2, size=100)
s5
#计算离散型随机变量PMF、连续性随机变量PDF
from scipy import stats
#计算二项分布B(10, 0.5)的随机变量概率质量函数(PMF)、分布函数CDF
x1 = range(11)
p1 = stats.binom.pmf(x1, n=10, p=0.5)
fb1 = stats.binom.cdf(x1, n=10, p=0.5)
print("PMF: ",p1)
print("CDF: ",fb1)
#计算泊松分布P(1)的PMF、CDF
x2 = range(11)
p2 = stats.poisson.pmf(x2, mu=1)
fb2 = stats.poisson.cdf(x2, mu=1)
print("PMF: ",p2)
print("CDF: ",fb2)
#计算均匀分布U(0,1)的PDF、CDF
x3 = numpy.linspace(0, 1, 100)
p3 = stats.uniform.pdf(x3, loc=0, scale=1)
fb3 = stats.uniform.cdf(x3, loc=0, scale=1)
print("PDF: ",p3)
print("CDF: ",fb3)
#计算正态分布N(0,1)的PDF、CDF
x4 = numpy.linspace(-3,3,100)
p4 = stats.norm.pdf(x4,loc=0,scale=1)
fb4 = stats