题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述:
输入一个string型基因序列,和int型子串的长度
输出描述:
找出GC比例最高的子串,如果有多个输出第一个的子串
输入例子:
AACTGTGCACGACCTGA 5
输出例子:
GCACG
取子串使用string::substr()函数即可,需要注意的是取子串的范围,也就是取子串的for循环需要从0开始,一直到str.size()-n为止,n表示输入限定的子串长度,可以取等号是因为子串可以为自身。否则测试集不能完全通过。
完整AC的代码:
#include <iostream>
using namespace std;
int main()
{
int n;
string str;
while(cin>>str>>n){
double maxRatio=0;
string maxRatioStr;
for(int i=0;i<=str.size()-n;i++){
string subStr=str.substr(i,n);
int cnt[4]={0};
for(auto c:subStr){
if(c=='A')cnt[0]++;
else if(c=='C')cnt[1]++;
else if(c=='G')cnt[2]++;
else if(c=='T')cnt[3]++;
}
double gcRatio=(double)(cnt[1]+cnt[2])/subStr.size();
if(gcRatio>maxRatio){
maxRatio=gcRatio;
maxRatioStr=subStr;
}
}
cout<<maxRatioStr<<endl;
}
return 0;
}