python按概率选取_python-以相等的概率从熊猫组中随机选择-意...

最新推荐文章于 2024-07-07 04:05:24 发布

指路明灯君

最新推荐文章于 2024-07-07 04:05:24 发布

阅读量1.2k

点赞数

文章标签： python按概率选取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28607671/article/details/112022449

版权

本文探讨如何在Python中从具有不同数量观察值的组中以相等概率随机选择数据框中的组。通过示例展示了使用np.random.choice函数时遇到的问题及其解决方法，特别是对于多个组（例如11个组）时出现的非均匀分布问题。讨论了可能的概率计算公式错误和浮点精度对结果的影响，并寻求更好的解决方案。

摘要由CSDN通过智能技术生成

我尝试随机抽取12个独特的组,每个组都有不同数量的观察值.我想从整个总体(数据框)中随机抽样,每组都有相同的概率被选中.最简单的示例是具有2组的数据框.

groups probability

0 a 0.25

1 a 0.25

2 b 0.5

使用np.random.choice(df [‘groups’],p = df [‘probability’],size = 100)现在,每次迭代都有50％的机会选择组a和50％的机会选择组b

为了得出概率,我使用了公式：

(1. / num_groups) / size_of_groups

或在Python中：

num_groups = len(df['groups'].unique()) # 2

size_of_groups = df.groupby('label').size() # {a: 2, b: 1}

(1. / num_groups) / size_of_groups

哪个返回

groups

a 0.25

b 0.50

直到我超过10个唯一的组,然后开始获得怪异的发行版,这才有效.这是一个小例子：

np.random.seed(1234)

group_size = 12

groups = np.arange(group_size)

probs = np.random.uniform(size=group_size)

probs = probs / probs.sum()

g = np.random.choice(groups, size=10000, p=p

最低0.47元/天解锁文章

指路明灯君

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python按概率选取_python-以相等的概率从熊猫组中随机选择-意...

我尝试随机抽取12个独特的组,每个组都有不同数量的观察值.我想从整个总体(数据框)中随机抽样,每组都有相同的概率被选中.最简单的示例是具有2组的数据框.groups probability0 a 0.251 a 0.252 b 0.5使用np.random.choice(df [‘groups’],p = df [‘prob...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。