Description
给定一个长度为n的序列,求有多少个区间满足区间内众数的出现次数严格大于区间长度的一半
n<=500000,0<=ai<=n-1
当所有数的出现次数<=15时
不难发现,此时满足条件的区间长度也很小(<=30),可以直接暴力
当max(ai)<=7时
考虑分别枚举0~7作为区间众数的贡献,显然贡献不会有重复
将所有等于
k
的位置取为1,不等于
k
的位置取为−1,得到新序列
B
并求前缀和得到序列S,则区间
[l,r]
需要被统计,当且仅当
Sr−Sl−1≥1
。从左到右枚举右端点,并用线段树维护当前右端点左边每种前缀和出现的次数即可。时间复杂度
O(8nlogn)
100%
考虑改进上述算法。我们取出所有
B
中的极长−1子区间,观察这些区间中的所有点作为右端点对答案的贡献。不难发现极长
−1
子区间
[l,r]
中的所有点作为右端点对答案的贡献为
∑r−l+1i=1∑Sl−1−i−1j=−∞cnt[j]
,其中
cnt[j]
表示在区间
[0,l−1]
之间前缀和为
j
的端点数目;在统计这段区间的答案后,我们还需要对区间[Si−1−(r−l+1),Si−1−1]中的所有
cnt
均进行
+1
操作。显然地,我们使用一个维护
Bi
和
Ci=i×Bi
的线段树就可以支持这些查询、修改操作。于是我们使用这棵线段树维护相关信息,并从左到右枚举右端点,统计答案即可。
不难发现,极长
−1
子区间的数目与序列中
k
的数目同阶,因此,对于统计众数为k的“新生舞会的”区间的时间开销,不难发现我们通过上述优化将时间开销缩短到了
O(序列A中k的数目logn)
于是,总时间复杂度即为
O(∑k序列A中k的数目logn)
,即
O(nlogn)
。
据说还有一种分治的做法,先留坑