一、题目描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述:输入一个string型基因序列,和int型子串的长度 n
输出描述:找出GC比例最高的子串,如果有多个输出第一个的子串
二、思路分析
从头遍历字符串,下标 i 位置到 (i + n) 为一组,计算出每一组中包含 “G” 和 “C” 的个数,找出个数最多的一组,将这一组的第一个字符下标保存下来,此位置到该位置 + n 处表示的字符串就是 GC-Ratio 最高的子序列。
三,代码
import java.util.*;
public class Main {