la 3602 DNA Consensus String

题目链接:点击打开链接

题目大意:给定m个长度均为n的DNA序列,求一个DNA序列,使它到所有序列的总Hamming距离尽量小.如果有多个解,输出字典序最小的解.

思路: 字符串遍历

分析:

1. Hamming距离就是不同的字符的个数.要使Hamming距离最小,那么对于目标DNA的每个位置,可以遍历所有m个序列的该位置,找到出现次数最多的碱基,就是这个位置的字符.这样以来,目标DNA和所有DNA不同字符的个数就能够达到最小.

2. 如果某个位置出现次数最多的字符有多个,选字典序小的那个,这样解的字典序就最小.

代码:

#include <iostream>
#include <string>
#include <cstdio>
#include <memory.h>
using namespace std;

const int maxm = 50 + 5;
const char* element = "ACGT";
string dna[maxm];
int m, n, diff;

string solve()
{
	int times[4], i, j;
	string ret = "";
	for (i = 0; i < n; ++i)
	{
		memset(times, 0, sizeof(times));
		for (j = 0; j < m; ++j)
		{
			switch(dna[j][i])
			{
			case 'A':
				++times[0];
				break;
			case 'C':
				++times[1];
				break;
			case 'G':
				++times[2];
				break;
			case 'T':
				++times[3];
				break;
			}
		}
		char maxc = element[0];
		int maxt = times[0];
		for (j = 1; j < 4; ++j)
			if (times[j] > maxt)
			{
				maxt = times[j];
				maxc = element[j];
			}
		ret += maxc;
		diff += m - maxt;
	}
	return ret;
}

int main()
{
	int kase;
	scanf("%d", &kase);
	while (kase--)
	{
		diff = 0;
		scanf("%d %d", &m, &n);
		for (int i = 0; i < m; ++i)
			cin >> dna[i];
		cout << solve() << endl;
		printf("%d\n", diff);
	}
	return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值