题目描述
有一个带权重的项目列表,要求从中随机选择1个,权重越大被选中的概率越大。例如给出:
[
{
"id": 1,
"weight": 80
},
{
"id": 2,
"weight": 70
},
{
"id": 3,
"weight": 50
}
]
id是项目的唯一标识,weight是对应的权重。随机选到id为1的项目概率最大,id为2的其次,选出id为3的概率最小。
思路1:
先计算权重都总和,例如上面的权重总和为200,然后某个项目在0-200之前占据了一部分概率区间,再生成一个随机数rand_num,落在哪个区间内,就表示随机选中对应的项目:
例如生成了一个随机数介于[0,50)之间,那就表明选中了id为3的项目;如果生成了一个随机数介于[50,120)之间,那就表明选中了id为2的项目;如果生成了一个随机数介于[120,200)之间,那就表明选中了id为1的项目。
思路2:
还是先计算权重的总和,为每个项目各生成一个随机数,如果小于等于自己的权重就表示被选中,再生成一个长度和项目列表长度的bool型列表,如果某个位置的项目被选中,该位置就置为true。例如:
然后这些被选中的项目可以单独放在一个列表中,从中随机选一个就可以实现最终加权随机的目标。如果一个列表中都没有选中可以多选择几次。
如果不需要严格按照权重大小值对应的概率去随机选择的话,可以先将项目列表按权重降序排列,权重大的排在前面,这样每次只选择第一个生成的项目,这样的结果随机选中的概率计算如下:
p(id=1) = 80/200
p(id=2) = (120/200) * (70/200) # id为1的没选中的情况下,id为2选中的概率
p(id=3) = (120/200) * (130/200) * (50/200)