Python 按分类权重(区间)随机获取分类样本

最新推荐文章于 2024-06-04 11:19:23 发布

chinaherolts2008

最新推荐文章于 2024-06-04 11:19:23 发布

阅读量539

点赞数 1

分类专栏： python基础教程文章标签： python 机器学习概率论

原文链接：https://www.cnblogs.com/shouke/p/13986965.html

版权

python基础教程专栏收录该内容

638 篇文章 51 订阅

订阅专栏

开发环境

win 10

python 3.6.5

需求

活动抽奖，参与抽奖产品有iphone, 华为，小米，魅族，vivo，三星手机，要求为这些不同品牌的手机设置被抽奖的概率(基准概率，非绝对概率，即允许存在一定偏差)，iphone为0，华为0.35，小米为0.25，魅族0.1，vivo和三星为0.15

代码实现

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

#!/usr/bin/env python

# -*- coding:utf-8 -*-

__author__ = 'shouke'

import random

def get_sample_by_rate(sample_rate_list):

if sum([item[1] for item in sample_rate_list]) != 1:

raise ValueError("样本比例配置错误，样本占比之和必须为1!")

random_normalized_num = random.random() # random() -> x in the interval [0, 1).

accumulated_probability = 0.0

for sample, probabilitie in sample_rate_list:

accumulated_probability += probabilitie

if random_normalized_num < accumulated_probability:

return sample

award_dict = {'iphone':0, '华为':0.35, '小米':0.25, '魅族':0.1, 'vivo':0.15, '三星':0.15}

# 初始化

output_dict = {} # 存放取样次数

for sample, rate in award_dict.items():

output_dict[sample] = 0

award_list = sorted(award_dict.items(), key=lambda arg:arg[1], reverse=False)

n = 1000 # 取样总次数

for i in range(n):

award = get_sample_by_rate(award_list)

output_dict[award] += 1

percentage_dict = {key: output_dict[key]/n for key in output_dict} # 存放样本数占比

print(output_dict)

print(percentage_dict)

　　

运行结果

注意

为啥可以用python的randowm函数来实现这个需求？那是因为python的random函数是平均分布函数，产生的随机数是等可能的。如下，可以把[0,1)区间看作一条线，生成的随机数可以看作是线条上一个个点，这样，就可以根据这个点所在位置，把这个点划分到某个区间（本例中划分了几个区间[0, 0.1)，[0.1，0.25)，[0.25，0.4)，[0.4， 0.65)，[0.65，1)），映射样本的概率范围

0 0.25 0.5 1

|--------|--------|----------------|

从运行结果来看，不难看出，这python教程种计算方式存在一定的偏差，比较适合大数据

作者：授客
本文版权归原作者所有，仅供学习参考之用，转载请注明出处，未经作者允许请务必保留此段声明！

chinaherolts2008

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。