UVa 1368 - DNA Consensus String (DNA序列)

最新推荐文章于 2024-07-08 21:23:20 发布

知道了喵

最新推荐文章于 2024-07-08 21:23:20 发布

阅读量100

点赞数

分类专栏： ACM算法题解文章标签： c++ 青少年编程

本文链接：https://blog.csdn.net/qq_35129075/article/details/128301161

版权

ACM算法题解专栏收录该内容

2 篇文章 0 订阅

订阅专栏

#cpp #字符串 #数组

题目描述

在这里插入图片描述

题解

方法：按列统计

思路

统计第一列每个字符的数量记到 int cnt[26] 中
找到数量最多的字符（如果存在相同的，取字典序小的），数量记为 maxCnt ，该字符就是最优字符。
m-maxCnt 即为该列的汉明距离
对其他列也按上述方法统计，所有列的汉明距离之和即为结果

代码

#include<bits/stdc++.h>
using namespace std;

int main() {
  int t;
  cin >> t;

  while(t--) {
    int m, n;
    cin >> m >> n;
    vector<string> dna(m);

    // 输入dna序列
    for (int i = 0; i < m; i++) {
      cin >> dna[i];
    }

    string ans;
    int ce = 0; // 保存 “consensus error”

    // 统计每列出现频率最高的字符
    for (int i = 0; i < n; i++) {
      int cnt[26] = {0};

      // 统计该列各个字符的数量
      for (int j = 0; j < m; j++) {
        cnt[dna[j][i] - 'A']++;
      }

      // 找到出现最多的字符
      int idx = 0;
      for (int i = 0; i < 26; i++) {
        if (cnt[i] > cnt[idx]) {
          idx = i;
        }
      }

      // 累计差异
      ce += m - cnt[idx];

      // 追加该列出现最多的字符
      ans.push_back((char)(idx + 'A'));
    }
    cout << ans << '\n' << ce << '\n';
  }
  return 0;
}