python统计分析——伯努利分布、二项分布、泊松分布

本文介绍了Python中用于统计分析的基本概率分布,包括伯努利分布(单次试验结果)、二项分布(多次独立试验次数)和泊松分布(连续时间或空间内事件计数)。通过实例展示了如何使用scipy和numpy库进行这些分布的计算和模拟。
摘要由CSDN通过智能技术生成

python统计分析【托马斯】

1、伯努利分布 

      单变量分布中最简单的例子,也是二项分布的基础,就是伯努利分布,它只有两种状态,例如,简单的破硬币试验。如果我们抛硬币(并且硬币没有被操控),希望“正面”出现的概率是p_{heads}=0.5。因为它必须是正面或反面,所以我们有:

p_{heads}+p_{tails}=1

        所以,“反面”的概率是p_{tails}=1-p_{heads}

        我们可以看到一个参数p=p_{heads}就决定了所有的事情,我们可以用下面的命令来确定这个分布。

# 导入库
from scipy import stats
# 设置参数
p=0.5
# 创建伯努利分布
bernoulliDist=stats.bernoulli(p)
# 计算正面出现1次或0次的概率
p_tails=bernoulliDist.pmf(0)
p_heads=bernoulliDist.pmf(1)
print("p_tails: ",p_tails)
print("p_heads: ",p_heads)
# 模拟10次伯努利试验
trails=bernoulliDist.rvs(10)
print("trials: ",trails)

2、二项分布

        如果我们掷硬币多次,并询问“正面出现的频率如何?”,这就涉及到了二项分布。一般来说,二项分布与“在给定(固定的)试验此书中,有多少会成功”有关。用二项分布建模的一些示例问题如下:

        抛10次硬币,有多少次正面朝上?

        在特定医院的特定的一天中,出生的小孩有多少个是女孩?

        有多少蚊子在喷洒杀虫剂后会死掉?

        我们进行n次重复试验,其成功的概率有参数p给出,并将成功的次数加起来。成功的次数有随机变量X表示。X的取值范围在0到n之间。

        在python中,程序和上面的伯努利分布一样,带有一个额外的参数和抛硬币次数。

# 导入库
from scipy import stats
import numpy as np
# 设置参数
(p,num)=(0.5,4)
# 创建伯努利分布
# 相当于掷4次骰子,正面朝上的次数的分布
binomialDist=stats.binom(num,p)
# 计算正面朝上为0,1,2,3,4次的概率
binomialDist.pmf(np.arange(0,5))

         得到的结果,应该为没有一次正面朝上的概率为0.0625,只有一次正面朝上的概率为0.25,依次类推,所有概率值加起来等于1。大家自行运行结果进行验证。

3、泊松分布

        泊松分布与二项分布非常相似,研究的是一个事件发生的次数。它们的差别是微妙的。二项分布着眼于我们在一个固定的试验总数中成功的次数,而泊松分布则测量了再连续的空间或时间内离散事件发生的次数。没有“总”的n值,泊松分布是由一个参数定义的。

        下面的问题可以用泊松分布来回答:

        ①我走路回家会捡到多少硬币?

        ②今天有多少孩子将在医院出生?

        ③播出一个新的电视广告后,我会卖出多少产品?

        ④每售出100m的绳子有多少缺陷?

        这个分布的细小差别在于,计算事件数量的随机变量X可以区任意非负整数值。换句话说,我可以走路回家,在街上捡不到硬币,也可能找到一枚硬币,也可能会发现10枚或更多硬币。

        与二项分布中用参数p表示概率组分不同,这次我们用“lambda”或λ参数来表示我们试验中“平均或期望”的事件发生数。泊松分布的概率质量函数可以由下式计算:

P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}

  • 5
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值