题面 :
题意:
n个数,他们相同的数的次数就是区间的价值,求n个数价值第k大区间的价值是?
思路:
最暴力求出n*(n+1)/2区间不同的值,然后排序求第k大的值,明显TLE。
我们先分析发现区间越大,价值肯定越大,并且呈单调性。我们就可以用二分去查找第k大的值。
对于每次二分的check,这里利用尺取的思想,尺取从左往右扫一遍最大区间[L,R]里的价值都是小于二分的mid,累加后可以在O(n)
时间内统计出n个数里比mid价值小的区间个数,总的时间复杂度就变成O(nlogn)
。在统计每个数出现次数时可以用map会超时,而n的范围可以用数组存下,但数值范围太大,于是用离散化操作。
代码
#include<bits/stdc++.h>
using namespace std;
const int N = 200010;
typedef long long ll;
ll a[N],temp[N],n,k;
int vis[N];
ll check(ll mid)//尺取求比mid小的区间个数
{
ll sum = 0,num = 0;
memset(vis,0,sizeof(vis));
for(int i=0,j=0;i<n;i++)
{
for(;j<n&&sum+vis[a[j]]<=mid;j++)
{
sum += vis[a[j]];
vis[a[j]]++;
}
num += j-i;//当前i,j范围内i作为起点的j个不同区间内值都比mid小
vis[a[i]]--;
sum -= vis[a[i]];
}
return num>=k;
}
int main(){
int T;cin>>T;
while(T--){
cin>>n>>k;
for(int i=0;i<n;i++){
cin>>a[i];
temp[i] = a[i];
}
int cnt;
sort(temp,temp+n);
cnt = unique(temp,temp+n) - temp;
for(int i=0;i<n;i++){
a[i] = lower_bound(temp,temp+cnt,a[i]) - temp; //离散化操作
}
ll l= 0,r = n*(n-1)/2;
while(l<=r){
ll mid = (l+r)/2;
if(check(mid)) r = mid-1;//说明mid大了
else l = mid+1;
}
cout<<r+1<<endl;
}
}