题:10亿个32位的无符号整数,里面有少量重复的,用最快的方法找出重复的数。
当时对数据不太敏感,认为一般的内存无法保存2^32位,后来突然想起来2^32位只需要战用256M的内存。解法如下:
分配一个2^32bit的位数组,32位的无符号数的按大小正好装入这个位数组中,初始化数组全0,扫描10亿个数据,检查其对应的位是否为1,如果为1则是重复的,如果为0,将其置1,继续扫描下一个数。
此解法为《编程珠玑》里的经典解法,
如果前提改为10亿个字符串用什么方法,还没想出来。
题:10亿个32位的无符号整数,里面有少量重复的,用最快的方法找出重复的数。
当时对数据不太敏感,认为一般的内存无法保存2^32位,后来突然想起来2^32位只需要战用256M的内存。解法如下:
分配一个2^32bit的位数组,32位的无符号数的按大小正好装入这个位数组中,初始化数组全0,扫描10亿个数据,检查其对应的位是否为1,如果为1则是重复的,如果为0,将其置1,继续扫描下一个数。
此解法为《编程珠玑》里的经典解法,
如果前提改为10亿个字符串用什么方法,还没想出来。