1 问题提出
设一个文件包含10亿条数据,其中每一条数据都是一个13开头的11位移动电话号码,且电话号码不重复,请用尽可能小的内存空间,将这些整数按升序进行排列,要求排序算法的时间复杂度为O(n)。
2 求解思路
难点包括两方面:时间复杂度和空间复杂度
1)时间复杂度:如果通过比较关键值(元素,电话号码)来排序,较快的算法时间复杂度也为O(nlogn),但是要求为O(n)。
2)空间复杂度,一条电话号码长度为11,10亿条大概需要4G内存,如何利用更小的内存来解决这个问题
方法:
可以使用位串数组的方式,来构造散列表,即如果某一电话号码存在可以令该电话号码为位串数组下标,并将相应位串元素置1。
算法实现步骤:
1)构造一个空的散列表:unsigned char ch[125000000] = {0}
2) 编写insert_ele子函数,实现在位串中插入一个元素
3)读取电话号码存放的文件,并调用insert_ele子函数,生成位串散列表
4)读取散列表,将位串中值为1的元素转换成相应的电话号码,存入文件中
C++程序
主函数
#include<iostream>
#include<stdlib.h>
#include<fstream>
#include"myatol.h"
using namespace std;
/*********************************************************/
/* 11位电话号码的排序,要求时间复杂度为O(n) */
/* 利用位串实现,排序 */
/*********************************************************/
// 算法实现步骤:
// 1)构造一个空的散列表:unsigned char ch[125000000] = {0}
// 2) 编写insert_ele子函数,实现在位串中插入一个元素
// 3)读取电话号码存放的文件,并调用insert_ele子函数,生成位串散列表