【算法】字符串hash

本文介绍了一种基于字符串哈希的快速DNA序列比对算法,通过维护哈希前缀和,实现对DNA序列中任意区间的快速比对,适用于大规模生物信息学研究。

题目描述
很久很久以前,森林里住着一群兔子。

有一天,兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式
第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

输出格式
对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 YesYes,否则输出 NoNo(注意大小写)。

数据范围
1≤length(S),m≤10000001≤length(S),m≤1000000
样例
输入样例:
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes

分析:

字符串哈希,维护哈希前缀和,实现线性查询

#include<iostream>
#include<cstdio>
#include<queue>
#include<vector>
#include<algorithm>
#include<bits/stdc++.h>
using namespace std;
#define hash 131
#define ull unsigned long long
typedef pair<int,int> PII;
const int N=1e6+7;
ull p[N],sum[N];
int n,m,len,l1,r1,l2,r2;
char s[N];
int main()
{
    scanf("%s",s+1);
    len=strlen(s+1);
    cin>>n;
    p[0]=1;
        for(int i=1;i<=len;i++){
            sum[i]=sum[i-1]*hash+(s[i]-'a'+1);
            p[i]=p[i-1]*hash;
        }
        for(int i=1;i<=n;i++){
            cin>>l1>>r1>>l2>>r2;
            if(sum[r1]-sum[l1-1]*p[r1-l1+1]==sum[r2]-sum[l2-1]*p[r2-l2+1]) cout<<"Yes"<<endl;
                else cout<<"No"<<endl;
        }
}


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值