20亿级别
1.如果直接做哈希,最坏的情况下,key需要4B,value需要4B,一共需要160亿B = 15GB,显然不行
2.如果不同的数据有2亿个,需要1.5GB 可以
3.有42亿万不同的数,每2亿放在一个文件里面,最多有20个文件
4. 分别统计20个文件里面的最大值,然后取最大即可
都处于 1~20000000 之间,那么你都会把他们全部映射到同一个文件中,你有优化思路吗?
对每个数字做哈希,使得这些数字分散到不同的文件中
40亿级别
unsigned int,其他不变
80亿级别