之前参加百度校招时遇到过一道“求一组线段的最大重叠区域”的算法题,当时没有搞定,汗颜!今天在网上看到了一位高手写的答案,恍然大悟,茅塞顿开!看了高手的解答之后才知道原来真不难,再次汗颜!将题目和代码如下,我在代码中加入了些注释。
【题目描述】
请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大重叠区间的大小。对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大小是同时属于行i和j的整数个数。例如:行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行 (12 10)和(10 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。
【输入数据】
程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会使用不同内容的输入文件。)
【输出数据】
在标准输出上打印出输入数据文件中最大重叠区间的大小,如果所有行都没有重叠区间,则输出0。
【评分标准】
程序输出结果必须正确,内存使用必须不超过256MB,程序的执行时间越快越好。
【题目描述】
请编写程序,找出下面“输入数据及格式”中所描述的输入数据文件中最大重叠区间的大小。对一个正整数n,如果n在数据文件中某行的两个正整数(假设为A和B)之间,即A<=n<=B或A>=n>=B,则n属于该行;如果n同时属于行i和j,则i和j有重叠区间;重叠区间的大小是同时属于行i和j的整数个数。例如:行(10 20)和(12 25)的重叠区间为[12 20],其大小为9;行 (12 10)和(10 18)的重叠区间为[10 12],其大小为3;行(20 10)和(20 30)的重叠区间大小为1。
【输入数据】
程序读入已被命名为input.txt的输入数据文本文件,该文件的行数在1到1,000,000之间,每行有用一个空格分隔的2个正整数,这2个正整数的大小次序随机,每个数都在1和2^32-1之间。(为便于调试,您可下载测试input.txt文件,实际运行时我们会使用不同内容的输入文件。)
【输出数据】
在标准输出上打印出输入数据文件中最大重叠区间的大小,如果所有行都没有重叠区间,则输出0。
【评分标准】
程序输出结果必须正确,内存使用必须不超过256MB,程序的执行时间越快越好。
代码中的qsort是一个系统函数,包含于stdlib.h中,该函数可以对用户指定的数据(或者说内存区域)进行快速排序,该函数的第三个参数为一个回调函数,指向用户定义的比较数据大小的函数。代码中的cmp函数就是作者写的按线段起点进行线段比较的函数,qsort将所有线段按起点大小进行排序。关于qsort函数的详细介绍,可以参考文章: http://blog.csdn.net/lewsn2008/article/details/8626000。
#include <stdio.h>
#include <stdlib.h>
#ifndef MIN
#define MIN(a,b) ((a)<(b)?(a):(b))
#endif
int map[1000000][2];
int cmp(const void *a, const void *b)
{
return *(int*)a > *(int*)b;
}
inline int cover(int n[2], int e)
{
int left = n[0];
int right = MIN(n[1], e);
if (left <= right)
return right - left + 1;
return 0;
}
int main()
{
FILE *fp = fopen("input.txt", "rt");
int i = 0, n, a, b;
int end;
int maxcover = 0, c;
while(fscanf(fp, "%d%d", &a, &b) == 2)
{
if (a < b)
{
map[i][0] = a;
map[i][1] = b;
}
else
{
map[i][0] = b;
map[i][1] = a;
}
i++;
}
fclose(fp);
n = i;
//LB_c: 对所有线段(n条)按线段的起点大小升序排列,注意每条线段占用两个int,所以qsort函数的第三个参数(即偏移量)为sizeof(int)*2。
// 而cmp函数中只取了指针所指的一个int的内容进行大小比较,也就是只取了线段的起点进行比较,所以最终qsort把所有线段按起点大小排序
// 了! 这里对qsort的使用非常巧妙!
qsort(map, n, sizeof(int)*2, cmp);
end = map[0][1];
for (i = 1; i < n; i++)
{
c = cover(map[i], end);
if (c > maxcover)
maxcover = c;
if (map[i][1] > end)
{
end = map[i][1];
}
}
printf("%d\n", maxcover);
return 0;
}