题目大意
给定一个长度为n的正整数序列a[],现有a[]中的所有元素任意两两做差,形成一个长度为 C n 2 C_n^2 Cn2的序列b[],求出b[]的中位数。
其中,1<=n<=1e5, 0<a[i]<1e9
问题分析
-
直接求出这些差值、排列、选中位数,显然会超时,其时间复杂度为O(n^2 log n^2) ,其中求值为O(n^2), 排列为O(m log m)。
-
二分查找的框架中,查找结果为符合check()条件的第一个位置
while(l<r)
{
int mid=l+(r-l)/2;
if(check(mid))//大于dif的数少于等于一半 ---------------+----
r=mid;
else
l=mid+1;
}
- 中位数的直观定义为数列中最中间的数,准确定来说就是数列排序后位置在最中间(当n为奇数时,中间为n/2+1,;当n为偶数时,中间为n/2<题目中定义>),换言之,也就是说,大于中位数的数占一半,小于中位数的数也占一半。但这样不够精准,因为可能和中位数相等的数有很多个。准确定义,应该是
大于中位数的数应少于等于总数的一半
数列a[] | 中位数mid | 大于mid的数量 |
---|---|---|
1 2 3* 4 5 | 3* | 2 |
1 2* 2 2 3 | 2* | 1 |
1 2* 2 3 4 | 2* | 2 |
1 2 3* 3 5 | 3* | 1 |
虽然最终找到的中位数的位置不一定为最中间的哪一个,但并不影响。
鉴于以上分析,中位数可以通过二分查找找出来,查找区间为[0 , max_a - max_b +1)
- 接下来应该研究的是如何确定大于某个数dif的数量。
若设当前需要检验的差值diff=Xj-Xi,那么每次固定一个Xi,找到所有比Xj大的X元素,也就是所有比(diff+Xi)大的X元素,每找到一个元素意味着找到了一个比diff大的差值,当Xi遍历后就能找到所有比diff大的差值,判断比diff大的差值个数是否少于等于m/2个,如果true。
AC代码
#include <iostream>
#include <cstdio>
#include <algorithm>
typedef long long ll;
using namespace std;
const int maxn=1e5+10;
int n;
ll m;
int a[maxn];
bool check(int dif)
{
ll sum=0;
for(int i=0;i<n;i++)
sum+=a+n-upper_bound(a+i,a+n,a[i]+dif);// >dif的数量 ------------------++++++++*-----
return sum<=m/2;// >dif的数量少于等于一半,即dif太大了
}
int main()
{
while(~scanf("%d",&n))
{
m=n*(n-1)/2;
for(int i=0;i<n;i++)
scanf("%d",&a[i]);
sort(a,a+n);
int l=0,r=a[n-1]-a[0]+1;
while(l<r)
{
int mid=l+(r-l)/2;
if(check(mid))//大于dif的数少于等于一半 ---------------+----
r=mid;
else
l=mid+1;
}
printf("%d\n",l);
}
return 0;
}