第二题(共四题100分):重叠区间大小(20分)
题目描述:请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大重叠区间的大小。
对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大小是同时属于行i和j的整数个数。
例如,行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行(20 10)和(12 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。
输入数据:程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会使用不同内容的输入文件。)
输出数据:在标准输出上打印出输入数据文件中最大重叠区间的大小,如果所有行都没有重叠区间,则输出0。
评分标准:程序输出结果必须正确,内存使用必须不超过256MB,程序的执行时间越快越好。
解题思路(网上参考来的,自己再总结一下):
将输入的区间的按起点从小到大进行排序,然后从第一个区间开始扫描所有数据,并用一个endMax来记录已经扫描过的数据的最大值。为什么要记录最大值呢?(这是这个问题的关键所在)。考虑这样三组数据 [Si,Ei],[Sj,Ej]它们已经是按起点从小到大进行排序了,现在假设已经扫描到[Sj,Ej]这里了,在计算它和[Si,Ei]的重叠区间是,应该是Length = End - Start +1,其中Start = max{Si,Sj} = Sj,End = min{Ei,Ej},现在Start已经确定,那就是要使End尽量取大一点的值才能使Length的值更大,所以对于i<j的所有[Si,Ei]来说,当Ej取最大值EndMax的时候,Length取到最大值。