python按指定概率抽样_python:抽样和抽样方法

本文介绍了抽样相关概念,包括总体、样本、样本大小和样本数量,以及统计量如均值和方差。文章还探讨了四种抽样方法:简单随机抽样、系统抽样、分层抽样和整群抽样,强调了如何确保样本的代表性。
摘要由CSDN通过智能技术生成

学习目标目标

知道总体、样本、样本大小、样本数量

知道样本统计量和总体统计量

知道总体分布、样本分布和抽样分布

知道常用的抽样方法

某糖果公司研发了一种超长效口香糖,为了得到口味持续时间的数据,公司聘请了试吃者帮忙完成检验,结果却让人大跌眼镜!

没文化,真可怕!我该怎么办? 有时候数据很容易收集,例如参加健身俱乐部的人的年龄,后这一家游戏公司的销售数据。但有时候不太容易,该怎么办呢? 是时候拿出终极武器了— 抽样

1.抽样相关概念

总体:是指研究对象的整个群体。

公司生产的一批糖果

样本:是从总体中选取的一部分,用于代表总体的整体情况。

在这批糖果中随机抽取50颗糖果

样本数量:又叫样本空间,是表示有多少个样本。

在这批糖果中随机抽取50颗糖果,抽5次:样本数量=5

样本大小:也叫样本容量,表示每个样本里有多少个数据。

每个样本50颗糖果:样本大小=50

统计量:

统计量是对数据进行统计得到的量,例如:均值、方差、标准差、比例等。总体统计量:总体XX

对总体进

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,你的问题是关于Python概率加权的随机抽样(Weighted Random Sampling)的实现,对吧? 对于这个问题,我可以介绍一种比较常见的实现方式,即使用A-Res蓄水池算法。这个算法可以在O(n)的时间复杂度下,实现概率加权的随机抽样。 具体实现方法如下: 1. 首先,我们需要定义一个权重列表,表示每个元素被抽中的概率。这个列表可以是任意的,只需要满足权重值的总和为1即可。 2. 接着,我们使用一个循环,依次遍历所有的元素。在每次循环中,我们都会生成一个随机数r,取值范围为[0, 1)。如果r小于当前元素的权重值,则将该元素加入抽样结果中。 3. 对于最后的抽样结果,我们可以将其返回,或者进行其他处理。 示例代码如下: ```python import random def weighted_random_sampling(items, weights, k): """ 使用A-Res蓄水池算法实现概率加权的随机抽样 :param items: 待抽样的元素列表 :param weights: 对应每个元素的权重列表 :param k: 抽样数量 :return: 抽样结果列表 """ n = len(items) if not 0 < k <= n: return [] # 初始化蓄水池 res = items[:k] w_sum = sum(weights[:k]) # 遍历剩余元素 for i in range(k, n): w = weights[i] if random.random() < w / w_sum: j = random.randint(0, k-1) res[j] = items[i] w_sum += w - weights[j] return res ``` 注意,这个算法的前提是需要预先知道所有元素的权重值,因此如果权重值是动态变化的,则需要实时更新权重列表。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值