3-7 DNA序列（DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368）

最新推荐文章于 2021-12-24 13:51:26 发布

weixin_33858485

最新推荐文章于 2021-12-24 13:51:26 发布

阅读量155

点赞数

原文链接：http://www.cnblogs.com/alonglyn/p/9953966.html

版权

输入 m 个长度均为 n 的 DNA 序列，求一个 DNA 序列，到所有序列的总 Hamming 距离尽量
小。两个等长字符串的 Hamming 距离等于字符不同的位置个数，例如， ACGT 和 GCGA 的
Hamming 距离为 2 （左数第 1, 4 个字符不同）。
输入整数 m 和 n （ 4≤ m ≤50, 4≤ n ≤1000 ），以及 m 个长度为 n 的 DNA 序列（只包含字母
A ， C ， G ， T ），输出到 m 个序列的 Hamming 距离和最小的 DNA 序列和对应的距离。如有多
解，要求为字典序最小的解。例如，对于下面 5 个 DNA 序列，最优解为 TAAGATAC 。
TATGATAC
TAAGCTAC
AAAGATCC
TGAGATAC

TAAGATGT

将A,C,G,T看成是0,1,2,3；

定义一个数组int ans[4][50];

对于每一行的输入，1<=i<=m；

ans[字母][i]++；

这样就记录了每一列每种字母出现的总次数；

最后遍历ans的每一列把每一列的第一个最大值所在行转换成字母

合起来就是最优解；

总行数减去字母出现最多的字母数在第一列到第n列求和就是hamming值

#include <bits/stdc++.h>

using namespace std;

int ans[4][1000];//放次数的数组
char DNA[50][1000];   //放输入DNA的数组
char mDNA[1000];    //放最优解得数组
int T,m,n;
map<char,int> m1;
char zimu[4]={'A','C','G','T'};
int main()
{
    //freopen("input.txt","r",stdin);
        m1['A']=0;
        m1['C']=1;
        m1['G']=2;
        m1['T']=3;
    scanf("%d",&T);
    while(T>0){
        int len=0;
        scanf("%d%d",&m,&n);
        getchar();
        memset(ans,0,sizeof(ans));
        for(int i=0;i<m;i++){
            int j=0;
            char c;

            while((c=getchar())!='\n'&&j<n){
                    int pos=0;
                switch(c){
                case 'A':
                    pos=0;break;
                case 'C':
                    pos=1;break;
                case 'G':
                    pos=2;break;
                case 'T':
                    pos=3;break;
                }
                ans[pos][j]++;
                j++;
            }
        }
        int max1;
        int pos1;
        for(int i=0;i<n;i++){
                max1=ans[0][i];
                pos1=0;
            for(int j=0;j<4;j++){
                if(ans[j][i]>max1){
                    max1=ans[j][i];
                    pos1=j;
                }
            }
            len+=m-max1;
            mDNA[i]=zimu[pos1];
        }
        for(int i=0;i<n;i++){
            putchar(mDNA[i]);
        }
        printf("\n%d\n",len);
        T--;
    }
    return 0;
}

转载于:https://www.cnblogs.com/alonglyn/p/9953966.html

weixin_33858485

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3-7 DNA序列（DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368）

输入m个长度均为n的DNA序列，求一个DNA序列，到所有序列的总Hamming距离尽量小。两个等长字符串的Hamming距离等于字符不同的位置个数，例如，ACGT和GCGA的Hamming距离为2（左数第1, 4个字符不同）。输入整数m和n（4≤m≤50, 4≤n≤1000），以及m个长度为n的DNA序列（只包含字母A，C，G，T），输出到m个序列的Ham...
复制链接

扫一扫