现在你有 10 个日志文件,每个日志文件大小约 300MB,每个文件里的日志都是按照时间戳从小到大排序的。你希望将这 10 个较小的日志文件,合并为 1 个日志文件,合并之后的日志仍然按照时间戳从小到大排列。如果处理上述排序任务的机器内存只有 1GB,你有什么好的解决思路,能“快速”地将这 10 个日志文件合并吗?
思路:
1.构建10个IO流,读取每个文件的一条数据,比较大小,取最小的放入新文件,再读取一条数据,循环直到结束。
现在你有 10 个日志文件,每个日志文件大小约 300MB,每个文件里的日志都是按照时间戳从小到大排序的。你希望将这 10 个较小的日志文件,合并为 1 个日志文件,合并之后的日志仍然按照时间戳从小到大排列。如果处理上述排序任务的机器内存只有 1GB,你有什么好的解决思路,能“快速”地将这 10 个日志文件合并吗?
思路:
1.构建10个IO流,读取每个文件的一条数据,比较大小,取最小的放入新文件,再读取一条数据,循环直到结束。