题目信息
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
本题含有多组样例输入。
输入描述
输入一个string型基因序列,和int型子串的长度
输出描述
找出GC比例最高的子串,如果有多个输出第一个的子串
示例输入
AACTGTGCACGACCTGA
5
示例输出
GCACG
题解
根据题目意思,可以得出
- 统计当前位置的接下来N-1个字符中C/G的个数,算上当前位置,一共是N个字符
- 对于输入字符串,可以转为字符数组来操作
编码
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
public class DnaSerial