LOJ#537. 「LibreOJ NOIP Round #1」DNA 序列

TS15oi

于 2020-10-07 17:15:32 发布

阅读量334

点赞数

分类专栏：测试——CSP模拟字符串——哈希文章标签： oi

本文链接：https://blog.csdn.net/qq_42754826/article/details/108952962

版权

测试——CSP模拟同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

字符串——哈希

2 篇文章 0 订阅

订阅专栏

description

NOIP 复赛之前，HSD 桑进行了一项研究，发现人某条染色体上的一段 DNA 序列中连续的 $k$ 个碱基组成的碱基序列与做题的 AC 率有关！于是他想研究一下这种关系。
现在给出一段 DNA 序列，请帮他求出这段 DNA 序列中所有连续 $k$ 个碱基形成的碱基序列中，出现最多的一种的出现次数。
$n\le5*10^6,k\le 10$

solution

直接找出所有连续 $k$ 个碱基形成的碱基序列的哈希值即可

code

#include<bits/stdc++.h>
using namespace std;
const int base=31;
const int mod=1e9+7;
const int N=5e6+10;
const int M=1e6+10;
char s[N];
int n,k,ans;
int t,hsh[N],pw[N];
vector<int>a[M],num[M];
inline void init(){
	pw[0]=1;hsh[0]=0;for(int i=1;i<=n;++i) pw[i]=1ll*pw[i-1]*base%mod;
	for(int i=1;i<=n;++i) hsh[i]=(1ll*hsh[i-1]*base%mod+(s[i]-'A'))%mod;
}
inline int gethsh(int l,int r){return (hsh[r]-1ll*hsh[l-1]*pw[r-l+1]%mod+mod)%mod;}
int main(){
	scanf("%s%d",s+1,&k);
	n=strlen(s+1);
	init();
	for(int i=1;i<=n-k+1;++i){
		t=gethsh(i,i+k-1);
		int u=t%M,flag=0;
		for(int j=0;j<a[u].size();++j)
			if(a[u][j]==t){
				ans=max(ans,++num[u][j]);
				flag=1;
				break;
			}
		if(!flag){
			a[u].push_back(t);
			num[u].push_back(1);
		}
	}
	printf("%d\n",ans);
	return 0;
}

TS15oi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LOJ#537. 「LibreOJ NOIP Round #1」DNA 序列

descriptionNOIP 复赛之前，HSD 桑进行了一项研究，发现人某条染色体上的一段 DNA 序列中连续的kkk个碱基组成的碱基序列与做题的 AC 率有关！于是他想研究一下这种关系。现在给出一段 DNA 序列，请帮他求出这段 DNA 序列中所有连续 kkk个碱基形成的碱基序列中，出现最多的一种的出现次数。n≤5∗106,k≤10n\le5*10^6,k\le 10n≤5∗106,k≤10solution直接找出所有连续kkk个碱基形成的碱基序列的哈希值，哈希值求出每种哈希值出现的次数
复制链接

扫一扫

专栏目录