题意:
给定串S和T,串只由"ACGT"四种字符组成,
问S中有多少子串,满足对该子串修改小于等于3个字符可以变成T。
数据范围:|S|,|T|<=1e5
解法:
参考了别人的解法.
考虑枚举匹配位置,然后判断能否匹配(成功匹配定义为字符不同的位置<=3)
对于两个长度相等的串S1和S2,
第一个不同的位置为lcp+1,
然后跳过lcp+1,从lcp+2位置开始继续求lcp,就能找到下一个不同的位置,
只需要判断不同的位置是否<=3即可,
lcp可以预处理sa+rmq,O(1)计算,
或者hash+二分,O(log)计算.
code:
#include <bits/stdc++.h>
using namespace std;
#define ull unsigned long long
const int maxm=1e5+5;
const int p=131;
ull base[maxm];
char s[maxm];
int n,m;
struct Node{
ull h[maxm];
int len;
void init(){
scanf("%s",s+1);
len=strlen(s+1);
for(int i=1;i<=len;i++){
h[i]=h[i-1]*p+s[i];
}
}
ull ask(int l,int r){
return h[r]-h[l-1]*base[r-l+1];
}
}e[2];
int lcp(int i,int j){
int l=0,r=m-j+1;
int ans=0;
while(l<=r){
int mid=(l+r)/2;
if(e[0].ask(i,i+mid-1)==e[1].ask(j,j+mid-1)){
ans=mid,l=mid+1;
}else{
r=mid-1;
}
}
return ans;
}
bool check(int pos){
int l=pos,r=1;
for(int i=1;i<=3;i++){//最多三个不同,跳四次
int len=lcp(l,r);
l+=len,r+=len;
l++,r++;
if(r>m)return 1;
}
return e[0].ask(l,pos+m-1)==e[1].ask(r,m);//跳三次之后,判断剩余部分是否相同
}
signed main(){
base[0]=1;
for(int i=1;i<maxm;i++){
base[i]=base[i-1]*p;
}
int T;scanf("%d",&T);
while(T--){
for(int i=0;i<2;i++){
e[i].init();
}
n=e[0].len,m=e[1].len;
int ans=0;
for(int i=1;i+m-1<=n;i++){//枚举匹配位置的开头
if(check(i)){//判断能否匹配
ans++;
}
}
printf("%d\n",ans);
}
return 0;
}