题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述:
输入一个string型基因序列,和int型子串的长度
输出描述:
找出GC比例最高的子串,如果有多个输出第一个的子串
示例1
输入
AACTGTGCACGACCTGA
5
输出
GCAC
#include <stdio.h>
#include <string.h>
int main()
{
char Arr[1024] = {0};
while(scanf("%s\n", Arr) != EOF)
{
int num = 0;
scanf("%d\n", &num);
int len = strlen(Arr);
int i, j, count = 0, max = 0, key_num = 0;
for(i = 0; i < len - num; i++)
{
count = 0;
for(j = 0; j < num; j++)
{
if(Arr[i + j] == 'C' || Arr[i + j] == 'G')
{
count++;
}
}
if(count > max)
{
max = count;
key_num = i;
}
}
for(j = 0; j < num; j++)
{
printf("%c", Arr[key_num + j]);
}
printf("\n");
}
return 0;
}