描述:
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列
输入:一个string型基因序列,和int型子串的长度
输出:找出GC比例最高的字串
#include<iostream> #include<string> using namespace std; int main() { int n,ratio,count0=0,count,mark=0; string str; cin >> str; cin >> n; int len = str.size(); for (int i = 0;i < n;i++) { if (str[i] == 'G' || str[i] == 'C') count0++; } for (int i = 0;i < len-n;i++) { count = 0; for (int j = i;j < i + n;j++) { if (str[j] == 'G' || str[j] == 'C') count++; } if (count > count0) { mark = i;count0 = count; } } for (int j = mark;j < mark + n;j++) { cout << str[j]; } return 0; }
样例输入 AACTGTGCACGACCTGA 5 样例输出 GCACG