学习总结:按权重随机选择——(LC528)(比较重要)

题目:

给定一个数组,数组每个位置的值表示该位置的权重,要求按照权重的概率去随机采样。

输入是一维正整数数组,表示权重;和一个包含指令字符串的一维数组,表示运行几次随机
采样。输出是一维整数数组,表示随机采样的整数在数组中的位置。

思路:

我们可以先使用 partial_sum 求前缀和(即到每个位置为止之前所有数字的和),这个结果
对于正整数数组是单调递增的。每当需要采样时,我们可以先随机产生一个数字,然后使用二分
法查找其在前缀和中的位置,以模拟加权采样的过程。这里的二分法可以用 lower_bound 实现。
以样例为例,权重数组[1,3]的前缀和为[1,4]。如果我们随机生成的数字为1,那么 lower_bound
返回的位置为 0;如果我们随机生成的数字是 2、3、4,那么 lower_bound 返回的位置为 1。

补充一些实战场景,以加深记忆(面试会加分吗 XD)

  • Spring Cloud Ribbon (客户端负载均衡)策略中的 WeightedResponseTimeRule
    • 此题可简述为「按权重,看作多个区间,按区间宽度越大,概率越大」
    • 在 Ribbon 相关架构中,服务端给客户端一个服务列表,类似 Map<String, Set<String>> 结构。若客户端想调用 key = serviceA,可选的具体服务端实例有 Set<String> 的 ["/svc/a1", "/svc/a2", "/svc/a3"],由客户端自行决定
    • Ribbon 作为客户端负载均衡来帮助客户端选择去哪个具体服务实例(a1 / a2 / a3),希望雨露均沾,又希望别运气不好抽到响应慢的服务器,故有了一种根据权重的均衡策略
    • 权重是通过定时统计最近一段时间内,a1 / a2 / a3 各自的访问响应时间如何,如 a1: 10msa2: 20msa3: 40ms
    • 通过算法(不赘述,有兴趣可留言喔)计算得 a1: [0, 60]a2: (60, 110]a3: (110, 140] 的区间对应
    • 下次再需要访问 serviceA 时,随机一个数 [0, 140],看落在哪个区间,就选那个实例
  • RabbitMQ 的 Topic 交换器使用 Trie 匹配
  • MySQL 中的 IN 语法涉及二分算法
class Solution {
  List<Integer>psum = new ArrayList<>();
  int tot=0;
  Random  rand = new Random();
    public Solution(int[] w) {
 for(int x : w){
     tot+=x;
   psum.add(tot);
 }
    }
    
    public int pickIndex() {
   int targ = rand.nextInt(tot);
    int low=0;
    int higth=psum.size()-1;
     while(low!=higth){
         int mid = (low+higth)/2;
         if(targ>=psum.get(mid)){
             low=mid+1;
         }else{
             higth=mid;
         }

     }
        return low;
    }
}

/**
 * Your Solution object will be instantiated and called as such:
 * Solution obj = new Solution(w);
 * int param_1 = obj.pickIndex();
 */

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是一个简单的随机加权采样的Python代码示例: ```python import random def weighted_random_sampling(weights, k): """ :param weights: A list of non-negative weights. :param k: The number of samples to draw. :return: A list of indices indicating the sampled elements. """ if k > len(weights): raise ValueError("k should be no greater than the length of weights.") cum_weights = [0] + list(accumulate(weights)) total_weight = cum_weights[-1] indices = [] for _ in range(k): rand = random.uniform(0, total_weight) for i, cum_weight in enumerate(cum_weights): if rand < cum_weight: indices.append(i - 1) total_weight -= weights[i - 1] cum_weights = [0] + list(accumulate(weights[:i - 1])) + [total_weight] weights = weights[:i - 1] + weights[i:] break return indices ``` 该函数的输入参数为权重列表和需要采样的数量。输出为一个采样结果的索引列表。 该函数的实现基于累计权重的概念。首先,通过累加所有权重,创建一个新的列表cum_weights。然后,将列表中的每个权重除以总权重,从而获得一个累计权重列表。这个累计权重列表中的每个条目表示前面所有权重的总和。 对于每个采样,生成一个随机数rand,介于0和总权重之间。然后,遍历累计权重列表,找到第一个大于rand的条目(即对应的权重),并将其对应的索引添加到结果列表中。接下来,将该索引对应的权重权重列表中删除,并更新cum_weights和total_weight。在下一次迭代中,只考虑剩余的权重。 关于加权随机采样,还需要注意以下几点: - 如果权重中有负数,会引发ValueError异常。 - 如果需要采样的数量k大于权重列表的长度,会引发ValueError异常。 - 由于使用了随机数,因此每次运行该函数都可能得到不同的结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一只程序小洋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值