编程珠玑12章习题 12.9 FLoyd随机取样算法的证明（转自编程珠玑续）

最新推荐文章于 2017-08-14 15:15:12 发布

cattylll

最新推荐文章于 2017-08-14 15:15:12 发布

阅读量1.1k

点赞数

分类专栏：编程珠玑文章标签：编程算法数据结构测试通讯

编程珠玑专栏收录该内容

8 篇文章 0 订阅

订阅专栏

13.3 随机排列

一些使用随机样本的程序要求样本的元素以随机的顺序出现。这样的序列被称为无重复的随机排列。例如，在测试一个排序程序的时候，随机产生的输入必须以随机的顺序出现；如果输入总是有序的，那么可能不能充分地测试排序代码。

我们可以利用Floyd算法F2产生一组随机样本，然后把它复制到一个数组中，最后打乱数组中元素的顺序。这段代码用于随机地打乱数组的顺序：

 
 for I := M downto 2 do  
    J := RandInt(1,  I)  
    Swap(X[J], X[I])

这个只有三个步骤的方法调用了RandInt函数2M次。

当本章原来在《ACM通讯》上发表后，几位读者发现上面的伪代码经过小的修改后，能够从1..N的整数中产生M元随机排列并放入X[1..M]中：

 
 for I := 1 to N do  
    X[I] := I 
for I := 1 to M do  
    J := RandInt(I, N)  
    Swap(X[J], X[I])

这个算法很容易实现成代码，但是它需要O(N)的运行时间和O(N)的空间。下面我们会看到，Floyd的算法在N相对于M比较大的时候，相比之下会更有效率。

Floyd的随机排列产生器与他的算法F2类似。为了产生1~N内的一组M元排列，它会先从1~N 1中产生一组M 1元的排列。（算法的递归版本中没有变量J。）但是，排列产生器的主要数据结构是序列而非集合。下面是Floyd的算法P。

算法P

 
 initialize sequence S to empty  
for J := N - M + 1 to N do  
     T   = RandInt(1, J)  
     if T is not in S then  
          prefix T to S  
      else  
    insert J in S after T