【问题描述】
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
【输入形式】输入一个string型基因序列,和int型子串的长度
【输出形式】找出GC比例最高的子串,如果有多个输出第一个的子串
【样例输入】AACTGTGCACGACCTGA 5
【样例输出】GCACG
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
String gene = scanner.next();
int subLength = scanner.nextInt();
String GCsub;
String MaxGCsub = "";
int MaxGC = 0;
for (int i = 0;i < gene.length()-subLength+1;i++){
int GC = 0;
GCsub = gene.substring(i,i+subLength);
for (int j = 0;j < GCsub.length();j++){
if (GCsub.charAt(j) == 'G'||GCsub.charAt(j) == 'C')GC++;
}
if (GC>MaxGC) {
MaxGCsub = gene.substring(i,i+subLength);
MaxGC = GC;
}
}
System.out.println(MaxGCsub);
}
}