HJ63 DNA序列

描述
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。

给定一个很长的DNA序列,以及限定的子串长度N,请帮助研究人员在给出的DNA序列中从左往右找出GC-Ratio最高且长度为N的第一个子串。
DNA序列为ACGT的子串有:ACG,CG,CGT等等,但是没有AGT,CT等等
输入描述:
输入一个string型基因序列,和int型子串的长度

输出描述:
找出GC比例最高的子串,如果有多个则输出第一个的子串

示例1
输入:
ACGT
2

输出:
CG

说明:
ACGT长度为2的子串有AC,CG,GT3个,其中AC和GT2个的GC-Ratio都为0.5,CG为1,故输出CG  
示例2
输入:
AACTGTGCACGACCTGA
5

输出:
GCACG

说明:
虽然CGACC的GC-Ratio也是最高,但它是从左往右找到的GC-Ratio最高的第2个子串,所以只能输出GCACG。
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int main(void)
{
    char str[100] = {0};
    char *p;
    int i, j, k;
    int num;
    int max;
    
    scanf("%s", str);
    scanf("%d", &num);
    p = (char* )malloc(num+1);
    max = 0;
    
    for(i=0; i<=strlen(str)-num; i++)
    {
        k = 0;
        for(j=i; j<i+num; j++)
        {
            if(str[j]=='C' || str[j]=='G')
            {
                k++;
            }
        }
        if(max < k)
        {
            max = k;
            strncpy(p, &str[i], num);
        }
    }
    printf("%s\n", p);
    free(p);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值