基因工程

最新推荐文章于 2021-08-17 20:14:01 发布

FTOTL

最新推荐文章于 2021-08-17 20:14:01 发布

阅读量484

点赞数 1

本文链接：https://blog.csdn.net/C20191522TL/article/details/79512879

版权

小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列，使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。

例如对于序列”ATCGATAC”和K=2,可以通过将第二个碱基修改为”C”使得最前面2个碱基与最后面两个碱基都为”AC”。当然还存在其他修改方法，例如将最后一个碱基改为”T”，或者直接将最前面两个和最后面两个碱基都修改为”GG”。

小Hi和小Ho希望知道在所有方法中，修改碱基最少的方法需要修改多少个碱基。

Input

第一行包含一个整数T(1 <= T <= 10)，代表测试数据的数量。

每组测试数据包含2行，第一行是一个由”ATCG”4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。

Output

对于每组数据输出最少需要修改的碱基数量。

Sample Input

2  
ATCGATAC  
2  
ATACGTCT
6

Sample Output

1  
3

思路

由于（1 <= K <= N）所以单纯的去对应改值显然是不对的。
那换一种思路，将所给字符串分段来做怎样？
例如：
ATACGTCT
6
时，将其想成两个。
ATACGTCT
ATACGTCT
然后将重叠部分与非重叠部分分开。
AT ACGT CT
AT ACGT CT
后以最前面那一段的长度（即字符串的长度减去k）
将字符串分段
AT AC GT CT
A B C D
AT AC GT CT
a b c d
则此时，要让b段与A段相同，即与a段相同。
则在改变b段的同时，B段也要改变，而c段又要与B段相同。
以此类推，则得到a，b，c，d四段要相同。
即求让a，b，c，d四段相同所需的最小改动值。

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int MAXN=1005;
int K,l,k,a[10],o,ans;
char c[MAXN];
int main()
{
    scanf("%d",&K);
    while(--K>=0)
    {
        for(int i=0;i<=l;i++)
            c[i]=0;
        ans=l=o=k=0;
        scanf("%s %d",c,&k);
        l=strlen(c);o=l-k;
        /*if(k<(l+1)/2)
        {
            for(int i=0;i<k;i++)
                if(c[i]!=c[i+l-k])
                    ans++;
            printf("%d\n",ans);
            continue;
        }*/
        for(int j=0;j<o;j++)
        {
            int you=0;
            for(int i=0;i*o+j<l;i++)
            {
                you++;
                switch(c[i*o+j])
                {
                    case 'A':a[1]++;break;
                    case 'T':a[2]++;break;
                    case 'C':a[3]++;break;
                    case 'G':a[4]++;break;
                }
            }
            ans+=you-*max_element(a+1,a+4+1);
            a[1]=a[2]=a[3]=a[4]=0;
        }
        printf("%d\n",ans);
    }
}

FTOTL

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基因工程

小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列，使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。例如对于序列”ATCGATAC”和K=2,可以通过将第二个碱基修改为”C”使得最前面2个碱基与最后面两个碱基都为”AC”。当然还存在其他修改方法，例如将最后一个碱基改为”T”，或者直接将最前面两个和最后面两个碱基都修改为”GG”。小...
复制链接

扫一扫