题目大意: 给出一个序列,求有多少个子区间满足众数的出现次数大于区间长度的一半
。
题解
考虑分治。
设当前处理到区间 [ l , r ] [l,r] [l,r]。对于当前区间,我们只需要统计有多少个满足要求的横跨 m i d mid mid 位置的子区间,不横跨 m i d mid mid 位置的子区间的统计二分下去做。
有这样一个性质:对于区间 [ l , r ] [l,r] [l,r],它的众数一定是区间 [ l , p ] [l,p] [l,p] 的众数或区间 [ p + 1 , r ] [p+1,r] [p+1,r] 的众数。那么在这里,我们要统计的区间都横跨 m i d mid mid 位置,不妨设 p = m i d p=mid p=mid。
那么我们只需要求出所有区间 [ x , m i d ] ( l ≤ x < m i d ) [x,mid]~~(l\leq x<mid) [x,mid] (l≤x<mid) 和区间 [ m i d , y ] ( m i d < y ≤ r ) [mid,y]~~(mid<y\leq r) [mid,y] (mid<y≤r) 的众数,就可以得知所有横跨 m i d mid mid 的子区间的众数。只需要从 m i d mid mid 往左往右各扫一遍,就可以找到这些众数。(找到的众数要去重)
可以证明,找出来的不同的众数的个数一定不大于 l o g ( 区 间 长 度 ) log(区间长度) log(区间长度),证明比较显然,考虑模拟极端情况即可证明,这里不再赘述。
然后我们枚举每一个众数,设当前枚举到的众数为 n o w n u m nownum nownum,于是问题变成了:有多少个横跨 m i d mid mid 的子区间中包含一半以上的 n o w n u m nownum nownum。
这里需要用到一个高端的转化:将区间中不是 n o w n u m nownum nownum 的数变成 − 1 -1 −1,是 n o w n u m nownum nownum 的数变成 1 1 1,那么问题变成了:有多少个横跨 m i d mid mid 的子区间的和大于 0 0 0。
神仙操作qwq
那么问题就好办了。
因为我们需要找的子区间一定横跨 m i d mid mid,那么这个区间的左端点一定在 [ l , m i d ] [l,mid] [l,mid] 中,右端点一定在 [ m i d + 1 , r ] [mid+1,r] [mid+1,r] 中,我们设它的左端点为 x x x,右端点为 y y y。
把区间内的数转化完后,我们求一个前缀和(设前缀和为 s u m sum sum),那么我们要找的子区间满足: s u m [ y ] − s u m [ x − 1 ] > 0 sum[y]-sum[x-1]>0 sum[y]−sum[x−1]>0,移项后也就是 s u m [ x − 1 ] < s u m [ y ] sum[x-1]<sum[y] sum[x−1]<sum[y],也就是说,对于每个 s u m [ y ] sum[y] sum[y],所有小于它的 s u m [ x − 1 ] sum[x-1] sum[x−1] 都是符合要求的,那么可以开一个桶,把所有 s u m [ x − 1 ] sum[x-1] sum[x−1] 存下来,然后对这个桶求一个前缀和,就可以 O ( 1 ) O(1) O(1) 找到有多少个小于 s u m [ y ] sum[y] sum[y] 的 s u m [ x − 1 ] sum[x-1] sum[x−1] 了。
有一个小细节:因为这个前缀和可以是负数,然而数组的下标不能是负数,所以我们需要给他一个偏移量,我设的偏移量为 n n n,也就是它题目中给我的 n n n,这个偏移量刚刚好,既不会因为小而导致RE,又不会因为大而浪费数组空间。
时间复杂度 O ( n l o g 2 n ) O(nlog^2n) O(nlog2n),但是实际上并跑不到那么大,所以毫无压力 AC 这题,最慢的点也就200ms左右。
还有不明白的就看代码吧:
#include <cstdio>
#include <cstring>
#define maxn 500010
#define ll long long
int n,type;
int a[maxn];
ll ans(0ll);
int num[maxn],t,tot[maxn];//num用来存找到的众数,tot是个辅助的数组,记录每个数的出现次数
bool isnum[maxn];//记录曾经是否被加入到num数组里
int sum[maxn*2];//桶,记得要开两倍空间,因为有偏移量
int min(int x,int y){return x<y?x:y;}
int max(int x,int y){return x>y?x:y;}
void solve(int l,int r)
{
if(l==r){ans++;return;}
int mid=l+r>>1;
solve(l,mid);solve(mid+1,r);
t=0;//先找出所有可能成为众数的数
for(int i=mid;i>=l;i--)//向左扩展
{
tot[a[i]]++;//记录出现次数
if(tot[a[i]]>(mid-i+1)/2&&!isnum[a[i]])isnum[a[i]]=true,num[++t]=a[i];
//假如出现次数大于区间长度的一半并且没有加入过,那么就把它加入到数组里
}
for(int i=mid;i>=l;i--)//记得清空tot数组,但是isnum数组不能清空
tot[a[i]]=0;
for(int i=mid;i<=r;i++)//向右扩展
{
tot[a[i]]++;
if(tot[a[i]]>(i-mid)/2&&!isnum[a[i]])isnum[a[i]]=true,num[++t]=a[i];
}
for(int i=l;i<=r;i++)//清空两个数组
tot[a[i]]=0,isnum[a[i]]=false;
int s,nownum;
for(int k=1;k<=t;k++)
{
s=0;nownum=num[k];//记录现在枚举到的众数
sum[n]++;//桶需要记录的是所有sum[x-1](这里的sum不是指桶,是上面的定义)
//因为x的取值范围是[l,mid],所以x-1的取值范围是[l-1,mid-1]
//我们需要考虑x-1=l-1时的情况,此时sum[x-1]=0,所以桶中的0+n位置要+1
for(int i=l;i<mid;i++)//注意只枚举到mid-1
{
s+=(a[i]==nownum?1:-1);//求转化后的前缀和
sum[s+n]++;//桶记录
}
s+=(a[mid]==nownum?1:-1);//别忘了让前缀和加上mid位置的值
for(int i=-(r-l+1);i<=r-l+1;i++)//让桶求一个前缀和
sum[i+n]+=sum[i+n-1];
for(int i=mid+1;i<=r;i++)
{
s+=(a[i]==nownum?1:-1);
ans+=sum[s+n-1];//找到小于当前前缀和的sum[x-1]的个数,统计答案
}
for(int i=-(r-l+1);i<=r-l+1;i++)
sum[i+n]=0;//清空sum数组
}
}
int main()
{
scanf("%d %d",&n,&type);
for(int i=1;i<=n;i++)
scanf("%d",&a[i]);
solve(1,n);
printf("%lld\n",ans);
}