DNA序列(DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368)

问题描述:

输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量 小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的 Hamming距离为2(左数第1, 4个字符不同)。
输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母 A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。如有多 解,要求为字典序最小的解。例如,对于下面5个DNA序列,最优解为TAAGATAC。
       TATGATAC
       TAAGCTAC
       AAAGATCC
       TGAGATAC
       TAAGATGT

解决方案:

每列字母出现最多的且字典序相对较小的为最优解该列字母

#include<stdio.h>
#include<string.h>
int main(){
	int m,n;
	char p[50][1000],b[1000];
	int na,nt,nc,ng,i,j; 
	printf("请输入m,n:");	
	scanf("%d%d",&m,&n);            //m为行n为列 
	printf("输入相应的DNA序列\n"); 
	
	for(i=0;i<m;i++)            //可以按回车依次输入下一行DNA序列 
        scanf("%s",&p[i]); 
	printf("\n");
	
	for(i=0;i<n;i++){
		na=0,nt=0,nc=0,ng=0;
		for(j=0;j<m;j++){
			switch(p[j][i]){
				case 'A':
					na+=1;
					break;
				case 'C':
					nc+=1;
					break;
				case 'G':
					ng+=1;
					break;
				case 'T':
					nt+=1;
					break;
			}
			
		}
		if(na>=nc&&na>=nt&&na>=ng) b[i]='A';
		if(nc>=na&&nc>=nt&&nc>=ng) b[i]='C';
		if(ng>=na&&ng>=nc&&ng>=nt) b[i]='G';
		if(nt>=na&&nt>=nc&&nt>=ng) b[i]='T';
	}
	for(i=0;i<n;i++){
		printf("%c",b[i]);
	}
	return 0;
} 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小wal

您的肯定是我创作的动力,谢谢。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值