对百万数量级文件排序思路:(作废,此方法不能解决问题)
1、读取文件
2、将数据换分为若干个中间文件
3、对中间文件进行排序
4、归并中间文件,比较取中间文件中第一行数据(因为中间文件排序后,每个文件最小的值会放在中间文件第一位)
例:
midF001:1、6、9
midF002:2、4、7
midF003:3、5、8
......
那最小值时,midF001中的1最小,将1拿出后,然后拿midF001的下一行数据6,然后对6、2、3进行比较,则拿出2,然后读取midF002的下一行数据4;对6、4、3进行比较,依次类推对中间文件归并。最后整理到最终文件中输出。