如何对 1 千万个整数进行快速排序

问题原型

一个最多包含 n 个正整数的文件,每个数都小于 n,其中 n = 10^7。此 n 个正整数不存在重复。请将这 n 个正整数按照升序排列。

问题约束

最多有大约 1MB 的内存空间可用,有充足的磁盘存储空间。运行时间最多几分钟,运行时间小于 10 秒。

问题分析

首先我们来看10^7个整数需要占用的空间大小 4*10^7个byte,即约 40MB 的空间,由于内存空间的限制,我们不可能把所有的数据同时读入内存中,但是由于磁盘空间充足我们可以将文件先存档到磁盘中,然后逐次来读写文件中的数据进行处理。

其次考虑用常规的排序方式进行数据排序的话,必然要分批进行排序,显然这将是一个耗时耗资源的事情。我们需要考虑其他方式来进行排序。通常对于处理大数据的常用位图法进行。

再次此处由于n个数是均小于n的非重复整数,故我们可以考虑用n个bit来表示n个整数,则需要的空间可以缩小 8 倍,也就是 10^7个整数需要 10^7 / 8 = 1.2 MB 空间。

问题解决

算法流程:
1、对给定大小的数组所有的比特位置0
2、循环读取输入文件的数据,并将对应数值大小的比特位置1
3、遍历数组各比特位,如果位为1,则输出对应比特位的位置整数。

c语言实现:

1 #include<stdio.h>
  2 #include<stdlib.h>
  3 
  4 #define CHAR_BIT   8  
  5 #define SHIFT      3
  6 #define MAX_NUM    10000000
  7 #define BIT_SIZE   10000000*8
  8 #define MAX_STR      10 //一个整数的最大字符数
  9 
 10 #define INPUT_FILE   "src_num.txt"
 11 #define OUTPUT_FILE   "dst_num.txt"
 12 
 13 int putIntoBitMap(char *bitmap, int num)
 14 {
 15     if(NULL == bitmap)
 16         return -2;
 17     if(num >= MAX_NUM || num < 0)
 18         return -1;
 19     int byte = num >> SHIFT;
 20     char bit = 1 << (num % CHAR_BIT);
 21     bitmap[byte] |= (char)bit;
 22    return 0;               
 23 }                          
 24                            
 47         fclose(in);
 48         return -1;
 49     }      
 50     int num = 0;
 51     while(fgets(string, NAX_STR, in) != NULL)
 52     {      
 53         num = atoi(string);
 54         putIntoBitMap(bitmap, num);
 55     }      
 56     fclose(in);
 57            
 58     /*遍历位图中的比特位,为1,则输出整数到文件中*/
 59     FILE *out = fopen(OUTPUT_FILE, "w+");
 60     if(NULL == out)
 61     {      
 62         printf("open dst num failed");
 63         free(bitmap);
 64         bitmap = NULL;
 65         return -1;
 66     }      
 67     int i; 
 68     for (i = 0; i < BIT_SIZE; i++)
 69     {      
 70         if (isInBitMap(bitmap , i)) 
 71         {  
 72             fprintf(out, "%d\n", i);
 73             //printf("%d\n",i);        
 74         }                              
 75                                        
 76     }                                  
 77     fclose(out);                       
 78     free(bitmap);                      
 79     bitmap = NULL;                     
 80     return 0;
 81 }
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 好的,以下是使用冒泡排序算法对随机十个整数进行升序排序的示例代码(使用 Python 语言实现): ```python import random # 生成随机整数数组 arr = [random.randint(1, 100) for i in range(10)] print("原始数组:", arr) # 冒泡排序 for i in range(len(arr)): for j in range(len(arr)-i-1): if arr[j] > arr[j+1]: arr[j], arr[j+1] = arr[j+1], arr[j] print("排序后的数组:", arr) ``` 运行以上代码,将输出类似如下的结果: ``` 原始数组: [4, 94, 24, 67, 47, 35, 27, 80, 34, 68] 排序后的数组: [4, 24, 27, 34, 35, 47, 67, 68, 80, 94] ``` 这里使用了 `random` 模块来生成随机整数数组,其中 `random.randint(1, 100)` 表示生成一个范围在 1 到 100 之间的整数。然后使用两层循环来实现冒泡排序,外层循环控制排序次数,内层循环进行相邻元素之间的比较和交换。最后输出排序后的结果。 ### 回答2: 冒泡排序法是一种基本的排序算法,其原理是通过相邻元素的比较和交换,将最大的元素逐步“冒泡”到数组的末尾。以下是使用冒泡排序法对随机十个整数进行升序排序的步骤: 1. 随机生成十个整数,并将它们存储在一个数组中。 2. 设定一个变量flag,用于标记当前一轮是否进行了元素交换。初始值为false。 3. 从数组的第一个元素开始,依次比较相邻的两个元素,如果前一个元素大于后一个元素,则交换它们的位置。 4. 继续遍历数组,重复执行步骤3,直到遍历到数组的倒数第二个元素。 5. 完成一轮的遍历后,判断flag的值。如果flag为false,表示该轮没有进行任何元素交换,说明数组已经有序,排序完成。如果flag为true,表示该轮进行了元素交换,说明数组还未完全有序,需要继续下一轮的遍历。 6. 如果还未完成排序,重复步骤3至步骤5,直到数组完全有序。 7. 最终得到的数组即为升序排列的结果。 使用冒泡排序法对随机十个整数进行升序排序的时间复杂度为O(n^2),其中n为数组的长度。尽管冒泡排序法的效率较低,但对于小规模的数组排序是一个简单而直观的选择。 ### 回答3: 冒泡排序算法是一种基础的排序算法,其核心思想是通过不断比较相邻的元素,将较大的元素逐渐移动到序列的末尾,从而实现升序排序。 假设我们有十个随机整数,为了进行冒泡排序,首先我们要进行n-1次遍历(这里n为数组长度),每次遍历时都将最大的元素移动到最后。具体的步骤如下: 1. 从第一个元素开始,比较它与下一个元素的大小,如果当前元素较大,则交换位置,将较大元素放在后面。 2. 继续比较下一个元素与其后面的元素,重复第一步的操作,直到将最大的元素移动到倒数第二个位置。 3. 重复上述步骤,每次遍历都将最大的元素移动到前一个未排序的位置。 4. 最后,当所有的元素都排好序时,冒泡排序完成。 以下是一个简单的冒泡排序的示例: 随机整数数组:[5, 7, 1, 9, 3, 2, 6, 4, 8, 10] 第一次遍历:[5, 1, 7, 3, 2, 6, 4, 8, 9, 10] 第二次遍历:[1, 5, 3, 2, 6, 4, 7, 8, 9, 10] 第三次遍历:[1, 3, 2, 5, 4, 6, 7, 8, 9, 10] 第四次遍历:[1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 经过四次遍历后,我们得到了升序排序的结果。 冒泡排序是一种简单但效率较低的排序算法,在处理大量数据时可能会变得很慢。在实际应用中,更常使用更为高效的排序算法,如快速排序、归并排序等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值