Python统计学之样本和总体的关系

本文探讨了样本与总体的关系,重点解释了样本占比的概念,包括总体中成功元素占比、样本大小的定义,以及如何推算样本达到指定成功占比的概率。文章还介绍了样本均值的计算及其在统计学中的应用,通过中心极限定理阐述了在大样本情况下样本均值的正态分布。最后,提供了具体的应用实例来说明这些统计概念。
摘要由CSDN通过智能技术生成

参考《深入浅出统计学》

样本和总体的关系:1.样本占比 2.样本均值

样本占比到底算的是什么?

概括的说,即,已知总体中成功元素占比及样本大小,推算出样本达到某指定成功占比的概率

分解概念1: 什么叫总体中成功元素占比?

举例说明:

  1. 假设总体为1000糖球,其中红色糖球的占比30%,此处30%为成功元素占比
  2. 假设总体为1000道题目,其中答对题目的占比为25%, 此处25%为成功元素占比。

分解概念2: 什么是样本大小呢?

比如1000粒糖球中取100粒样本,100粒糖球就是这个样本的大小。

分解概念3: 推算出样本达到某指定成功占比的概率,这句话是什么意思呢?

  • 比如我们要求推算100粒糖球中(总体1000粒)红色糖球占比20%的概率。其中,20%为指定样本成功占比。100为样本大小。
  • 再例如,我们要求推算200道题目中(总体1000道题)答对50%的概率。其中,50%为指定样本成功占比,200为样本大小。

思路与计算公式

  1. 关于这类模式的计算我们需要从题目中提炼下面三个要素:
  • n - 已知样本数目
  • p - 已知总体成功暂避
  • x - 指定样本成功占比
  • 求样本中某个成功占比的概率 P s P_s Ps
  1. 根据以上信息,计算样本均值和方差:
    均值: E ( P s ) = p E(P_s)=p E(Ps)=p
    方差: V a r ( P s ) = p q n ( q = 1 − p ) Var(P_s)=\frac{pq}{n} (q=1-p) Var(Ps)=npqq=1p)

  2. 确定 P s P_s Ps的分布
    当n很大时(所谓很大,即n>30), P s P_s Ps近似如下正态分布:
    P s ∽ N ( p , p q n ) P_s \backsim N\Big(p,\frac{pq}{n}\Big) Ps<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xupeggy163

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值