P3763 [TJOI2017]DNA(LCP)

题意:

给定串S和T,串只由"ACGT"四种字符组成,
问S中有多少子串,满足对该子串修改小于等于3个字符可以变成T。

数据范围:|S|,|T|<=1e5

解法:
参考了别人的解法.

考虑枚举匹配位置,然后判断能否匹配(成功匹配定义为字符不同的位置<=3)
对于两个长度相等的串S1和S2,
第一个不同的位置为lcp+1,
然后跳过lcp+1,从lcp+2位置开始继续求lcp,就能找到下一个不同的位置,
只需要判断不同的位置是否<=3即可,

lcp可以预处理sa+rmq,O(1)计算,
或者hash+二分,O(log)计算.
code:
#include <bits/stdc++.h>
using namespace std;
#define ull unsigned long long
const int maxm=1e5+5;
const int p=131;
ull base[maxm];
char s[maxm];
int n,m;
struct Node{
    ull h[maxm];
    int len;
    void init(){
        scanf("%s",s+1);
        len=strlen(s+1);
        for(int i=1;i<=len;i++){
            h[i]=h[i-1]*p+s[i];
        }
    }
    ull ask(int l,int r){
        return h[r]-h[l-1]*base[r-l+1];
    }
}e[2];
int lcp(int i,int j){
    int l=0,r=m-j+1;
    int ans=0;
    while(l<=r){
        int mid=(l+r)/2;
        if(e[0].ask(i,i+mid-1)==e[1].ask(j,j+mid-1)){
            ans=mid,l=mid+1;
        }else{
            r=mid-1;
        }
    }
    return ans;
}
bool check(int pos){
    int l=pos,r=1;
    for(int i=1;i<=3;i++){//最多三个不同,跳四次
        int len=lcp(l,r);
        l+=len,r+=len;
        l++,r++;
        if(r>m)return 1;
    }
    return e[0].ask(l,pos+m-1)==e[1].ask(r,m);//跳三次之后,判断剩余部分是否相同
}
signed main(){
    base[0]=1;
    for(int i=1;i<maxm;i++){
        base[i]=base[i-1]*p;
    }
    int T;scanf("%d",&T);
    while(T--){
        for(int i=0;i<2;i++){
            e[i].init();
        }
        n=e[0].len,m=e[1].len;
        int ans=0;
        for(int i=1;i+m-1<=n;i++){//枚举匹配位置的开头
            if(check(i)){//判断能否匹配
                ans++;
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值