题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述:
输入一个string型基因序列,和int型子串的长度
输出描述:
找出GC比例最高的子串,如果有多个输出第一个的子串
示例1
输入
AACTGTGCACGACCTGA 5
输出
GCACG
代码:
//第六十一题 DNA序列
#include<iostream>
#include<string>
using namespace std;
int main()
{
string str;
int n;
while (cin >> str >> n)
{
int iMax = str.length() - n+1;
if (iMax < 1)
continue;
int iMaxQ = 0;
int iMaxId = 0;
for (int i = 0; i < iMax; i++)
{
int jMax = i + n;
int tQ = 0;
for (int j = i; j < jMax; j++)
{
if (str[j] == 'C'||str[j] == 'G')
tQ++;
}
if (iMaxQ < tQ)
{
iMaxId = i;
iMaxQ = tQ;
}
}
cout << str.substr(iMaxId, n) << endl;
}
return 0;
}