题目大意
给定一个长度为n的数组,让你找出出现次数大于等于k次的字串的最大长度。
做题思路
这道题在做的时候可以把数组想象成字符串,然后题目就变为了一个简单的Hash找字串的问题。
暴力
直接枚举每个字串的长度,再枚举对应长度的起点,然会对每个字串Hash的话,时间复杂度为 O ( n 3 ) O(n^3) O(n3),会直接爆♂炸。
优化
对于上面的做法,在 n ≤ 2 ∗ 1 0 5 n\leq2*10^5 n≤2∗105的情况下肯定是会TLE的,那么我们就要想一想优化的方案。
这里有一个比较明显的性质
对于一个长度为
n
n
n的串
s
s
s,
s
s
s加上某个字符组成一个长度为
n
+
1
n+1
n+1的串
t
t
t,
t
t
t在原串中的出现次数不大于
t
t
t在原串中的出现次数。
即:对于一个字串s,比它长的每一个字串t在原数组中的出现次数小于等于s
所以字串的长度是有单调性的(长度越大,出现次数越少)。那么我们就可以通过二分的方法枚举这个 n n n,取左右两端点的和的一半 m i d mid mid作为字串的长度,再对于长度为 m i d mid mid的字串对应地进行判断,看看有没有哪种串出现此处大于等于k次即可,如果满足需求,就继续扩大区间。
那么这道题就变成了Hash+二分答案。
C o d e Code Code
#include<bits/stdc++.h>
#define int unsigned long long
using namespace std;
const int p=133331;//取大纸鼠(不是)质数
int n,k,a[100005]/*原数组*/,power[100005]/*p的i次方*/,h[100005]/*Hash数组*/,ans;
map<int,int>mp;//不用map会爆♂炸
bool check(int mid)//检查该长度是否合法
{
int ans=0;
for(int r=mid; r<=n; r++)
{
//[l,r]为要查找的长度的字串(r-l+1=mid)
int l=r-mid+1;
// cout<<mid<<"\n";
int s=h[r]-h[l-1]*power[mid];//该字串对应的Hash值
mp[s]++;//该字串出现次数++
ans=max(ans,mp[s]);
}
return ans>=k;//如果该长度下的字串(模式)出现次数大于等于k
}
signed main()
{
cin>>n>>k;
for(int i=1; i<=n; i++)
{
cin>>a[i];
}
power[0]=1;//任何数的0次幂为1
for(int i=1; i<=n; i++)//初始化纸鼠(不是)质数的纸鼠(不是)指数
{
power[i]=power[i-1]*p;
}
for(int i=1; i<=n; i++)//初始化Hash数组
{
h[i]=h[i-1]*p+a[i];
}
int l=0,r=n+1;
while(l<r-1)//二分查找
{
int mid=(l+r)>>1;//mid为枚举的长度
if(check(mid))
{
l=mid;//如果合法则继续增加长度mid
}
else
{
r=mid;//反之亦然
}
}
cout<<l;
return 0;
}