Codeforces528 D. Fuzzy Search(bitest)

题意:

给定长度为n的串S和长度为m的串T,还有一个整数k
串只由ACGT组成,问T串在S串中出现了多少次,匹配机制比较特殊:
定义T[i]能匹配上S[j],当且仅当T[i]在S[j-k,j+k]中出现过,即存在偏移位差k

数据范围:n,m,k<=2e5

解法:
考虑没有偏移的时候怎么计算匹配数,
可以KMP,但是偏移之后就不行了,
考虑用bitset计算匹配:
对每个字符集单独考虑,
假设当前选择字符为x,
令S串中x字符为1,其他字符为0,那么变成一个01,4种字符处理就会得到401,A的01串设为bitset(A).
开一个bitset<N>ans,赋值为全1,
遍历T串,当遇到t[i]的时候,ans&=(bitset(t[i])>>(i-1))
剩下来的1表示t[i]可以被匹配的开头位置,
遍历完之后,还剩下的1就是合法的开头位置了.

每个字符可以被匹配的范围为[i-k,i+k],
这个可以差分预处理出来,然后也得到4bitset()
然后按照上面的匹配做就行了.
code:
#include<bits/stdc++.h>
using namespace std;
const int maxm=2e5+5;
char s[maxm];
char t[maxm];
int d[4][maxm];
int n,m,k;
bitset<maxm>bit[4],temp;
signed main(){
    map<char,int>mp;
    mp['A']=0;
    mp['C']=1;
    mp['G']=2;
    mp['T']=3;
    //
    scanf("%d%d%d",&n,&m,&k);
    scanf("%s",s+1);
    scanf("%s",t+1);
    //转化为数字,方便处理
    for(int i=1;i<=n;i++){
        s[i]=mp[s[i]];
    }
    for(int i=1;i<=m;i++){
        t[i]=mp[t[i]];
    }
    //差分预处理
    for(int i=1;i<=n;i++){
        d[s[i]][max(1,i-k)]++;
        d[s[i]][min(n,i+k)+1]--;
    }
    for(int i=0;i<4;i++){
        for(int j=1;j<=n;j++){
            d[i][j]+=d[i][j-1];
            if(d[i][j]){
                bit[i][j]=1;
            }
        }
    }
    //
    for(int i=1;i<=n;i++){
        temp[i]=1;
    }
    for(int i=1;i<=m;i++){//最后为1的位置就是合法位置.
        temp&=(bit[t[i]]>>(i-1));
    }
    int ans=0;
    for(int i=1;i<=n;i++){
        ans+=temp[i];
    }
    cout<<ans<<endl;
    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值