胜者树-败者树-归并选择排序(详解)

胜者树与败者树  


       胜者树和败者树都是完全二叉树,是树形选择排序的一种变型。每个叶子结点相当于一个选手,每个中间结点相当于一场比赛,每一层相当于一轮比赛。

 

      不同的是,胜者树的中间结点记录的是胜者的标号;而败者树的中间结点记录的败者的标号。

 

       胜者树与败者树可以在log(n)的时间内找到最值。任何一个叶子结点的值改变后,利用中间结点的信息,还是能够快速地找到最值。在k路归并排序中经常用到。

 

一、胜者树

      

       胜者树的一个优点是,如果一个选手的值改变了,可以很容易地修改这棵胜者树。只需要沿着从该结点到根结点的路径修改这棵二叉树,而不必改变其他比赛的结果。


Fig. 1

Fig.1是一个胜者树的示例。规定数值小者胜。

1.         b3 PK b4,b3胜b4负,内部结点ls[4]的值为3;

2.         b3 PK b0,b3胜b0负,内部结点ls[2]的值为3;

3.         b1 PK b2,b1胜b2负,内部结点ls[3]的值为1;

4.         b3 PK b1,b3胜b1负,内部结点ls[1]的值为3。.

当Fig. 1中叶子结点b3的值变为11时,重构的胜者树如Fig. 2所示。

1.         b3 PK b4,b3胜b4负,内部结点ls[4]的值为3;

2.         b3 PK b0,b0胜b3负,内部结点ls[2]的值为0;

3.         b1 PK b2,b1胜b2负,内部结点ls[3]的值为1;

4.         b0 PK b1,b1胜b0负,内部结点ls[1]的值为1。.

Fig. 2

 

 

二、败者树

 

       败者树是胜者树的一种变体。在败者树中,用父结点记录其左右子结点进行比赛的败者,而让胜者参加下一轮的比赛。败者树的根结点记录的是败者,需要加一个结点来记录整个比赛的胜利者。采用败者树可以简化重构的过程。

 

Fig. 3

Fig. 3是一棵败者树。规定数大者败。

1.         b3 PK b4,b3胜b4负,内部结点ls[4]的值为4;

2.         b3 PK b0,b3胜b0负,内部结点ls[2]的值为0;

3.         b1 PK b2,b1胜b2负,内部结点ls[3]的值为2;

4.         b3 PK b1,b3胜b1负,内部结点ls[1]的值为1;

5.         在根结点ls[1]上又加了一个结点ls[0]=3,记录的最后的胜者。

败者树重构过程如下:

·            将新进入选择树的结点与其父结点进行比赛:将败者存放在父结点中;而胜者再与上一级的父结点比较。

·            比赛沿着到根结点的路径不断进行,直到ls[1]处。把败者存放在结点ls[1]中,胜者存放在ls[0]中。

Fig. 4

       Fig. 4是当b3变为13时,败者树的重构图。

 

       注意,败者树的重构跟胜者树是不一样的,败者树的重构只需要与其父结点比较。对照Fig. 3来看,b3与结点ls[4]的原值比较,ls[4]中存放的原值是结点4,即b3与b4比较,b3负b4胜,则修改ls[4]的值为结点3。同理,以此类推,沿着根结点不断比赛,直至结束。

 

        由上可知,败者树简化了重构。败者树的重构只是与该结点的父结点的记录有关,而胜者树的重构还与该结点的兄弟结点有关。



败者树 多路平衡归并外部排序


一 外部排序的基本思路

假设有一个72KB的文件,其中存储了18K个整数,磁盘中物理块的大小为4KB,将文件分成18组,每组刚好4KB。

首先通过18次内部排序,把18组数据排好序,得到初始的18个归并段R1~R18,每个归并段有1024个整数。

然后对这18个归并段使用4路平衡归并排序:

第1次归并:产生5个归并段

R11   R12    R13    R14    R15

其中

R11是由{R1,R2,R3,R4}中的数据合并而来

R12是由{R5,R6,R7,R8}中的数据合并而来

R13是由{R9,R10,R11,R12}中的数据合并而来

R14是由{R13,R14,R15,R16}中的数据合并而来

R15是由{R17,R18}中的数据合并而来

把这5个归并段的数据写入5个文件:

foo_1.dat    foo_2.dat    foo_3.dat     foo_4.dat     foo_5.dat

 

第2次归并:从第1次归并产生的5个文件中读取数据,合并,产生2个归并段

R21  R22

其中R21是由{R11,R12,R13,R14}中的数据合并而来

其中R22是由{R15}中的数据合并而来

把这2个归并段写入2个文件

bar_1.dat   bar_2.dat

 

第3次归并:从第2次归并产生的2个文件中读取数据,合并,产生1个归并段

R31

R31是由{R21,R22}中的数据合并而来

把这个文件写入1个文件

foo_1.dat

此即为最终排序好的文件。

 

二 使用败者树加快合并排序

外部排序最耗时间的操作时磁盘读写,对于有m个初始归并段,k路平衡的归并排序,磁盘读写次数为

|logkm|,可见增大k的值可以减少磁盘读写的次数,但增大k的值也会带来负面效应,即进行k路合并

的时候会增加算法复杂度,来看一个例子。

把n个整数分成k组,每组整数都已排序好,现在要把k组数据合并成1组排好序的整数,求算法复杂度

u1: xxxxxxxx

u2: xxxxxxxx

u3: xxxxxxxx

.......

uk: xxxxxxxx

算法的步骤是:每次从k个组中的首元素中选一个最小的数,加入到新组,这样每次都要比较k-1次,故

算法复杂度为O((n-1)*(k-1)),而如果使用败者树,可以在O(logk)的复杂度下得到最小的数,算法复杂

度将为O((n-1)*logk), 对于外部排序这种数据量超大的排序来说,这是一个不小的提高。

 

关于败者树的创建和调整,可以参考清华大学《数据结构-C语言版》

 

三 产生二进制测试数据

打开Linux终端,输入命令

dd if=/dev/urandom of=random.dat bs=1M count=512

 这样在当前目录下产生一个512M大的二进制文件,文件内的数据是随机的,读取文件,每4个字节

看成1个整数,相当于得到128M个随机整数。


四 程序实现


 
 
  1. #include <assert.h>
  2. #include <fcntl.h>
  3. #include <stdio.h>
  4. #include <stdlib.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. #include <sys/time.h>
  8. #include <sys/types.h>
  9. #include <sys/stat.h>
  10. #define MAX_INT ~(1<<31)
  11. #define MIN_INT 1<<31
  12. //#define DEBUG
  13. #ifdef DEBUG
  14. #define debug(...) debug( __VA_ARGS__)
  15. #else
  16. #define debug(...)
  17. #endif
  18. #define MAX_WAYS 100
  19. typedef struct run_t {
  20. int *buf; /* 输入缓冲区 */
  21. int length; /* 缓冲区当前有多少个数 */
  22. int offset; /* 缓冲区读到了文件的哪个位置 */
  23. int idx; /* 缓冲区的指针 */
  24. } run_t;
  25. static unsigned int K; /* K路合并 */
  26. static unsigned int BUF_PAGES; /* 缓冲区有多少个page */
  27. static unsigned int PAGE_SIZE; /* page的大小 */
  28. static unsigned int BUF_SIZE; /* 缓冲区的大小, BUF_SIZE = BUF_PAGES*PAGE_SIZE */
  29. static int *buffer; /* 输出缓冲区 */
  30. static char input_prefix[] = "foo_";
  31. static char output_prefix[] = "bar_";
  32. static int ls[MAX_WAYS]; /* loser tree */
  33. void swap(int *p, int *q);
  34. int partition(int *a, int s, int t);
  35. void quick_sort(int *a, int s, int t);
  36. void adjust(run_t ** runs, int n, int s);
  37. void create_loser_tree(run_t **runs, int n);
  38. long get_time_usecs();
  39. void k_merge(run_t** runs, char* input_prefix, int num_runs, int base, int n_merge);
  40. void usage();
  41. int main(int argc, char **argv)
  42. {
  43. char filename[ 100];
  44. unsigned int data_size;
  45. unsigned int num_runs; /* 这轮迭代时有多少个归并段 */
  46. unsigned int num_merges; /* 这轮迭代后产生多少个归并段 num_merges = num_runs/K */
  47. unsigned int run_length; /* 归并段的长度,指数级增长 */
  48. unsigned int num_runs_in_merge; /* 一般每个merge由K个runs合并而来,但最后一个merge可能少于K个runs */
  49. int fd, rv, i, j, bytes;
  50. struct stat sbuf;
  51. if (argc != 3) {
  52. usage();
  53. return 0;
  54. }
  55. long start_usecs = get_time_usecs();
  56. strcpy(filename, argv[ 1]);
  57. fd = open(filename, O_RDONLY);
  58. if (fd < 0) {
  59. printf( "can't open file %s\n", filename);
  60. exit( 0);
  61. }
  62. rv = fstat(fd, &sbuf);
  63. data_size = sbuf.st_size;
  64. K = atoi(argv[ 2]);
  65. PAGE_SIZE = 4096; /* page = 4KB */
  66. BUF_PAGES = 32;
  67. BUF_SIZE = PAGE_SIZE*BUF_PAGES;
  68. num_runs = data_size / PAGE_SIZE; /* 初始时的归并段数量,每个归并段有4096 byte, 即1024个整数 */
  69. buffer = ( int *) malloc(BUF_SIZE);
  70. run_length = 1;
  71. run_t **runs = ( run_t **) malloc( sizeof( run_t *)*(K+ 1));
  72. for (i = 0; i < K; i++) {
  73. runs[i] = ( run_t *) malloc( sizeof( run_t));
  74. runs[i]->buf = ( int *) calloc( 1, BUF_SIZE+ 4);
  75. }
  76. while (num_runs > 1) {
  77. num_merges = num_runs / K;
  78. int left_runs = num_runs % K;
  79. if(left_runs > 0) num_merges++;
  80. for (i = 0; i < num_merges; i++) {
  81. num_runs_in_merge = K;
  82. if ((i+ 1) == num_merges && left_runs > 0) {
  83. num_runs_in_merge = left_runs;
  84. }
  85. int base = 0;
  86. printf( "Merge %d of %d,%d ways\n", i, num_merges, num_runs_in_merge);
  87. for (j = 0; j < num_runs_in_merge; j++) {
  88. if (run_length == 1) {
  89. base = 1;
  90. bytes = read(fd, runs[j]->buf, PAGE_SIZE);
  91. runs[j]->length = bytes/ sizeof( int);
  92. quick_sort(runs[j]->buf, 0, runs[j]->length -1);
  93. } else {
  94. snprintf(filename, 20, "%s%d.dat", input_prefix, i*K+j);
  95. int infd = open(filename, O_RDONLY);
  96. bytes = read(infd, runs[j]->buf, BUF_SIZE);
  97. runs[j]->length = bytes/ sizeof( int);
  98. close(infd);
  99. }
  100. runs[j]->idx = 0;
  101. runs[j]->offset = bytes;
  102. }
  103. k_merge(runs, input_prefix, num_runs_in_merge, base, i);
  104. }
  105. strcpy(filename, output_prefix);
  106. strcpy(output_prefix, input_prefix);
  107. strcpy(input_prefix, filename);
  108. run_length *= K;
  109. num_runs = num_merges;
  110. }
  111. for (i = 0; i < K; i++) {
  112. free(runs[i]->buf);
  113. free(runs[i]);
  114. }
  115. free(runs);
  116. free(buffer);
  117. close(fd);
  118. long end_usecs = get_time_usecs();
  119. double secs = ( double)(end_usecs - start_usecs) / ( double) 1000000;
  120. printf( "Sorting took %.02f seconds.\n", secs);
  121. printf( "sorting result saved in %s%d.dat.\n", input_prefix, 0);
  122. return 0;
  123. }
  124. void k_merge(run_t** runs, char* input_prefix, int num_runs, int base, int n_merge)
  125. {
  126. int bp, bytes, output_fd;
  127. int live_runs = num_runs;
  128. run_t *mr;
  129. char filename[ 20];
  130. bp = 0;
  131. create_loser_tree(runs, num_runs);
  132. snprintf(filename, 100, "%s%d.dat", output_prefix, n_merge);
  133. output_fd = open(filename, O_CREAT|O_WRONLY|O_TRUNC,
  134. S_IRWXU|S_IRWXG);
  135. if (output_fd < 0) {
  136. printf( "create file %s fail\n", filename);
  137. exit( 0);
  138. }
  139. while (live_runs > 0) {
  140. mr = runs[ls[ 0]];
  141. buffer[bp++] = mr->buf[mr->idx++];
  142. // 输出缓冲区已满
  143. if (bp* 4 == BUF_SIZE) {
  144. bytes = write(output_fd, buffer, BUF_SIZE);
  145. bp = 0;
  146. }
  147. // mr的输入缓冲区用完
  148. if (mr->idx == mr->length) {
  149. snprintf(filename, 20, "%s%d.dat", input_prefix, ls[ 0]+n_merge*K);
  150. if (base) {
  151. mr->buf[mr->idx] = MAX_INT;
  152. live_runs--;
  153. } else {
  154. int fd = open(filename, O_RDONLY);
  155. lseek(fd, mr->offset, SEEK_SET);
  156. bytes = read(fd, mr->buf, BUF_SIZE);
  157. close(fd);
  158. if (bytes == 0) {
  159. mr->buf[mr->idx] = MAX_INT;
  160. live_runs--;
  161. }
  162. else {
  163. mr->length = bytes/ sizeof( int);
  164. mr->offset += bytes;
  165. mr->idx = 0;
  166. }
  167. }
  168. }
  169. adjust(runs, num_runs, ls[ 0]);
  170. }
  171. bytes = write(output_fd, buffer, bp* 4);
  172. if (bytes != bp* 4) {
  173. printf( "!!!!!! Write Error !!!!!!!!!\n");
  174. exit( 0);
  175. }
  176. close(output_fd);
  177. }
  178. long get_time_usecs()
  179. {
  180. struct timeval time;
  181. struct timezone tz;
  182. memset(&tz, '\0', sizeof(struct timezone));
  183. gettimeofday(&time, &tz);
  184. long usecs = time.tv_sec* 1000000 + time.tv_usec;
  185. return usecs;
  186. }
  187. void swap(int *p, int *q)
  188. {
  189. int tmp;
  190. tmp = *p;
  191. *p = *q;
  192. *q = tmp;
  193. }
  194. int partition(int *a, int s, int t)
  195. {
  196. int i, j; /* i用来遍历a[s]...a[t-1], j指向大于x部分的第一个元素 */
  197. for (i = j = s; i < t; i++) {
  198. if (a[i] < a[t]) {
  199. swap(a+i, a+j);
  200. j++;
  201. }
  202. }
  203. swap(a+j, a+t);
  204. return j;
  205. }
  206. void quick_sort(int *a, int s, int t)
  207. {
  208. int p;
  209. if (s < t) {
  210. p = partition(a, s, t);
  211. quick_sort(a, s, p -1);
  212. quick_sort(a, p+ 1, t);
  213. }
  214. }
  215. void adjust(run_t ** runs, int n, int s)
  216. {
  217. int t, tmp;
  218. t = (s+n)/ 2;
  219. while (t > 0) {
  220. if (s == -1) {
  221. break;
  222. }
  223. if (ls[t] == -1 || runs[s]->buf[runs[s]->idx] > runs[ls[t]]->buf[runs[ls[t]]->idx]) {
  224. tmp = s;
  225. s = ls[t];
  226. ls[t] = tmp;
  227. }
  228. t >>= 1;
  229. }
  230. ls[ 0] = s;
  231. }
  232. void create_loser_tree(run_t **runs, int n)
  233. {
  234. int i;
  235. for (i = 0; i < n; i++) {
  236. ls[i] = -1;
  237. }
  238. for (i = n -1; i >= 0; i--) {
  239. adjust(runs, n, i);
  240. }
  241. }
  242. void usage()
  243. {
  244. printf( "sort <filename> <K-ways>\n");
  245. printf( "\tfilename: filename of file to be sorted\n");
  246. printf( "\tK-ways: how many ways to merge\n");
  247. exit( 1);
  248. }

五 编译运行

gcc sort.c -o sort -g

./sort random.dat 64

以64路平衡归并对random.dat内的数据进行外部排序。在I5处理器,4G内存的硬件环境下,实验结果如下

文件大小    耗时

128M        14.72 秒

256M        30.89 秒

512M        71.65 秒

1G             169.18秒

 

六 读取二进制文件,查看排序结


 
 
  1. #include <assert.h>
  2. #include <fcntl.h>
  3. #include <stdio.h>
  4. #include <stdlib.h>
  5. #include <string.h>
  6. #include <unistd.h>
  7. #include <sys/time.h>
  8. #include <sys/types.h>
  9. #include <sys/stat.h>
  10. int main(int argc, char **argv)
  11. {
  12. char *filename = argv[ 1];
  13. int *buffer = ( int *) malloc( 1<< 20);
  14. struct stat sbuf;
  15. int rv, data_size, i, bytes, fd;
  16. fd = open(filename, O_RDONLY);
  17. if (fd < 0) {
  18. printf( "%s not found!\n", filename);
  19. exit( 0);
  20. }
  21. rv = fstat(fd, &sbuf);
  22. data_size = sbuf.st_size;
  23. bytes = read(fd, buffer, data_size);
  24. for (i = 0; i < bytes/ 4; i++) {
  25. printf( "%d ", buffer[i]);
  26. if ((i+ 1) % 10 == 0) {
  27. printf( "\n");
  28. }
  29. }
  30. printf( "\n");
  31. close(fd);
  32. free(buffer);
  33. return 0;
  34. }


  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值