题意:
给定一个长度为n的序列A,一个长度为m(m<=n)的序列B,询问A中有多少个位置x满足:
以 x , x+p , x+(2*p) .... x+(m-1)*p下标组成新的长度为m的序列C,且C中出现的每一个数在B中出现的次数相同。
思路:
首先一个暴力的想法是:
枚举所有能组成数列的起点,然后统计新数列中每个元素出现的次数,和B数列比对看是不是一样,是就计入答案。
那么这个想法的复杂度为 O( n * m ) (极限状态下起点最多有n个,每个新数列长度为m,比对可以在遍历新数列时同步进行,不需要额外的时间)。
很明显可以进行优化
对于起点为x 和 x+p 的数列,他们的区别仅仅在于少了第一个元素,多了最后一个元素,那么当我统计完x数列后,可以O(1)的得到x+p数列的信息:
x数列的第一个数的计数减一,x数列最后一个数(x+(m-1)*p)的下一个数(x+m*p)的计数加一
那么就能在O( n )的时间内得到结果( 每个位置的信息最多只会用到两次 )
因为数列中的值较大,可以用map<int,int>来进行统计,map的复杂度为log(N),那么总的复杂度O(nlog(n))也属于O(能过)。
一个常数优化:
这里我先对B数列进行排序,然后将B数列从小到大映射到(1...k)(注意:k<=m,因为相等的数会映射到同一个数),然后对A中出现在B的数作同样的修改,没有出现过的设为0即可,那么我们就能在O(1)的进行计数,虽然总的复杂度还是O(m*log(m))(排序的复杂度),但是很明显我们会进行大量的查询和计数操作,所以时间还是优化很多的。
代码:
#include<bits/stdc++.h>
using namespace std;
int n,m,p;
int A[200005];
int B[200005];
map<int,int>M;
vector<int>ans;
int k = 0;
bool vis[200005];
int num[200005];
int numm[200005];
void oper(int x,int& cnt){
x = A[x];
numm[x]++;
if(numm[x]==num[x])cnt++;
else if(numm[x]==num[x]+1)cnt--;
}
void work(int pos){
memset(numm,0,sizeof(numm));
int cnt = 0,index=pos;
for(int i=1;i<=m;index+=p,i++){
oper(index,cnt);
}
if(cnt==k)ans.emplace_back(pos);
vis[pos]=true;
while(index<=n){
if(vis[pos+p])return ;
oper(index,cnt);
int x = A[pos];
numm[x]--;
if(numm[x]==num[x])cnt++;
else if(numm[x]==num[x]-1)cnt--;
if(cnt==k)ans.emplace_back(pos+p);
vis[pos+p] = true;
index+=p;
pos+=p;
}
}
int main()
{
scanf("%d%d%d",&n,&m,&p);
for(int i=1;i<=n;i++){
vis[i] = false;
scanf("%d",&A[i]);
}for(int i=1;i<=m;i++){
scanf("%d",&B[i]);
}sort(B+1,B+1+m);
num[0] = 1e9;
for(int i=1;i<=m;i++){
if(B[i]!=B[i-1]){
M[B[i]]=++k;
}num[k]++;
}for(int i=1;i<=n;i++){
A[i] = M[A[i]];
}
long long ed = n - 1LL*(m-1)*p ;
for(int i=1;i<=ed;i++){
if(!vis[i])work(i);
else break;
}sort(ans.begin(),ans.end());
printf("%d\n",ans.size());
for(int i=0;i<ans.size();i++){
printf("%d ",ans[i]);
}printf("\n");
}