题目描述
基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 'A'
、'C'
、'G'
和 'T'
之一。
假设我们需要调查从基因序列 start
变为 end
所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。
- 例如,
"AACCGGTT" --> "AACCGGTA"
就是一次基因变化。
另有一个基因库 bank
记录了所有有效的基因变化,只有基因库中的基因才是有效的基因序列。(变化后的基因必须位于基因库 bank
中)
给你两个基因序列 start
和 end
,以及一个基因库 bank
,请你找出并返回能够使 start
变化为 end
所需的最少变化次数。如果无法完成此基因变化,返回 -1
。
注意:起始基因序列 start
默认是有效的,但是它并不一定会出现在基因库中。
示例:
输入:start = "AACCGGTT", end = "AACCGGTA", bank = ["AACCGGTA"]
输出:1
解题思路
乍一看,以为是动态规划的经典类型----编辑距离。后考虑到操作状态有限,且在状态转移时在dp数组上需要考虑状态的合法性,实现起来比较复杂。
不难发现,将不同的基因视为一个结点,基因间只在一个位置下存在差异视为结点有连接,start
,end
,bank[]
即为结点全集。故问题就转变为从结点start
到结点end
,求最短路!
无权图,直接上广度优先。
代码实现
class Solution {
public:
int minMutation(string start, string end, vector<string>& bank) {
//合法的结点集合
unordered_set<string> legal;
//去重用
unordered_set<string> visited;
for(string &s : bank){
legal.insert(s);
}
//end结点本身非法,无解,返回 -1
if(!legal.count(end)) return -1;
queue<string> que;
que.push(start);
visited.insert(start);
//突变选项
char mutation[4] = {'A', 'C', 'G', 'T'};
int ans = 0;
while(!que.empty()){
//统计当前层含有的个数
int size = que.size();
while(size--){
string curr = que.front();
que.pop();
//突变成功,返回当前计数
if(curr == end) return ans;
for(int i = 0; i < 8; i++){
//回溯
string s = curr;
for(int j = 0; j < 4; j++){
s[i] = mutation[j];
//结点合法且结点未访问过
if(legal.count(s) && !visited.count(s)){
que.push(s);
visited.insert(s);
}
}
}
}
//层数 + 1
ans++;
}
//遍历所有结点后仍未突变成功,无解
return -1;
}
};
运行结果: