题目描述:输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量
小。两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的
Hamming距离为2(左数第1, 4个字符不同)。
输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母
A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。如有多
解,要求为字典序最小的解。例如,对于下面5个DNA序列,最优解为TAAGATAC。
TATGATAC
TAAGCTAC
AAAGATCC
TGAGATAC
TAAGATGT
题目分析:题中引入了Hamming距离的定义,看似要与m个序列比较求最小和十分麻烦,实际上用通俗的语言描述就是:求每个序列的对应位置出现次数的最多的字母,然后输出。题目的描述其实就是这个意思,分别找出每一列哪个元素重复次数最多。输入的m行n列元素用二维数组a存储,为了方便引入另一个数组b,其值为a的'转置'(行和列互换),这样每次需要比较的元素就在一行中,方便放入函数的参数中(因为需要循环多次,故将求重复次数最多的字母的方法放入函数中),因为要计算次数并且求和,于是再引入一个数组q,其中存放的是每一列ACGT出现的次数,注意ACGT对应q[1]q[2]q[3]q[4],即按字典序从小到大的顺序存放