2017 计蒜之道初赛第一场 B题（阿里天池的新任务）

最新推荐文章于 2020-10-31 23:17:40 发布

你有多高

最新推荐文章于 2020-10-31 23:17:40 发布

阅读量648

点赞数

分类专栏： # ACM/ICPC题解文章标签：计蒜之道

本文链接：https://blog.csdn.net/MM__1997/article/details/72594341

版权

ACM/ICPC题解专栏收录该内容

166 篇文章 0 订阅

订阅专栏

阿里“天池”竞赛平台近日推出了一个新的挑战任务：对于给定的一串 DNA 碱基序列 $t$ ，判断它在另一个根据规则生成的 DNA 碱基序列 $s$ 中出现了多少次。

首先，定义一个序列 $w$ ：

$\displaystyle w_{i} = \begin{cases}b, & i = 0\\(w_{i-1} + a) \mod n, & i > 0\end{cases}$

接下来，定义长度为 $n$ 的 DNA 碱基序列 $s$ （下标从 $0$ 开始）：

$\displaystyle s_{i} = \begin{cases}A , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\T , & (L \le w_{i} \le R) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\\G , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 0)\\C , & ((w_{i} < L) \lor (w_{i} > R)) \land (w_{i}\ \mathrm{mod}\ 2 = 1)\end{cases}$

其中 $\land$ 表示“且”关系， $\lor$ 表示“或”关系， $a\ \mathrm{mod}\ b$ 表示 $a$ 除以 $b$ 的余数。

现给定另一个 DNA 碱基序列 $t$ ，以及生成 $s$ 的参数 $n, a, b, L, R$ ，求 $t$ 在 $s$ 中出现了多少次。

输入格式

数据第一行为 $5$ 个整数，分别代表 $n, a, b, L, R$ 。第二行为一个仅包含A、T、G、C的一个序列 $t$ 。

数据保证 $0 < a < n,$ $\le b < n,$ $\le L \le R < n,$ $\le 10^{6}$ ， $a, n$ 互质。

对于简单版本， $\leq n \leq 10^{6}$ ；

对于中等版本， $\leq n \leq 10^{9}, a = 1$ ；

对于困难版本， $\leq n \leq 10^{9}$ 。

输出格式

输出一个整数，为 $t$ 在 $s$ 中出现的次数。

样例说明

对于第一组样例，生成的 $s$ 为TTTCGGAAAGGCC。

样例输入1

13 2 5 4 9
AGG

样例输出1

样例输入2

103 51 0 40 60
ACTG

样例输出2

分析：

用kmp算法即可

代码：

#include <stdio.h>
#include <string.h>
long long count=0;  
long long next[1000005];  

void get_next(char * s)   
{  
    long long i=0,j=-1;  
    next[0]=-1;  
    long long len=strlen(s);  
    while(i<len)  
    {  
        if(j==-1||s[i]==s[j])  
        {  
            i++;j++;  
            if(s[i]==s[j])  
              next[i]=next[j];  
            else  
             next[i]=j;  
        }  
        else  
        {  
            j=next[j];  
        }  
    }  
}  

void kmp(char * str,char * str2)  
{  
    long long i=-1,j=-1;            
    long long len2=strlen(str2);  
    long long len1=strlen(str);  
    while(i<len1)  
    {  
        if(j==-1||str[i]==str2[j])  
        {  
            i++;j++;  
        }  
        else  
        {  
            j=next[j];  
        }  
        if(j==len2)     
        {  
            count++;  
            j=next[j];    
        }  
    }  
}  
int main (){
	char str[1000005];
	char str2[1000005];
	long long n,a,b,L,R;
	long long wi;
	scanf ("%lld%lld%lld%lld%lld",&n,&a,&b,&L,&R);
	getchar();
	scanf("%s",str2);
	wi=b;//                                       生成序列 
	if (wi>=L&&wi<=R){
		if (wi%2==0)
			str[0]='A';
		else 
			str[0]='T';
	}
	else {
		if (wi%2==0)
			str[0]='G';
		else 
			str[0]='C';
	}	
	for (long long i=1;i<n;i++){
			wi=(wi+a)%n;
			if (wi>=L&&wi<=R){
				if (wi%2==0)
					str[i]='A';
				else 
					str[i]='T';
			}
			else {
				if (wi%2==0)
					str[i]='G';
				else
					str[i]='C';
			}
	}
	
	get_next(str2); 
	kmp(str,str2);
	printf ("%lld",count);
	return 0;
}

你有多高

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2017 计蒜之道初赛第一场 B题（阿里天池的新任务）

阿里“天池”竞赛平台近日推出了一个新的挑战任务：对于给定的一串 DNA 碱基序列 tt，判断它在另一个根据规则生成的 DNA 碱基序列 ss 中出现了多少次。首先，定义一个序列 ww：\displaystyle w_{i} = \begin{cases}b, & i = 0\\(w_{i-1} + a) \mod n, & i > 0\end{cases}wi={b
复制链接

扫一扫