random.sample() 函数原理

AllenGates

于 2024-07-30 18:04:15 发布

阅读量451

点赞数 3

文章标签：算法 python

本文链接：https://blog.csdn.net/qq_17743307/article/details/140803184

版权

random.sample() 函数在 Python 中是基于 Fisher-Yates（或 Knuth）洗牌算法的一个变种实现的。这个算法可以高效地随机打乱一个序列，而 random.sample() 则利用这个算法来从序列中随机选择不重复的元素。以下是 random.sample() 的基本实现原理：

原理步骤：

初始化:
- 确定总体的长度 n 和需要采样的数量 k。
- 创建一个空列表 sample 用于存放选中的样本。
选择第一个样本:
- 从 0 到 n-1 的范围内随机选择一个索引 i。
- 将 population[i] 添加到 sample 列表中。
- 为了确保不会再次选择到这个元素，将 population[n-1] 与 population[i] 交换位置，并将 n 减去 1。
选择后续样本:
- 对于后续的每个样本，从 0 到 n-2 的范围内随机选择一个索引（因为 n 每次都在减少）。
- 将 population[i] 添加到 sample 列表中。
- 将 population[n-2] 与 population[i] 交换位置，并将 n 减去 1。
重复步骤:
- 重复步骤 3，直到 sample 列表中有 k 个元素。
完成:
- 当 sample 列表中有 k 个元素时，停止抽样。
  以下是这个算法的伪代码：

def random_sample(population, k):
    n = len(population)
    sample = []
    for i in range(k):
        # 从当前未选择的元素中随机选择一个
        j = random integer from 0 to n-1
        # 将选择的元素添加到样本列表
        sample.append(population[j])
        # 将选择的元素与未选择元素中的最后一个交换位置
        population[j], population[n-1] = population[n-1], population[j]
        # 减少未选择的元素数量
        n -= 1
    return sample