基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 'A'
、'C'
、'G'
和 'T'
之一。
假设我们需要调查从基因序列 start
变为 end
所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。
- 例如,
"AACCGGTT" --> "AACCGGTA"
就是一次基因变化。
另有一个基因库 bank
记录了所有有效的基因变化,只有基因库中的基因才是有效的基因序列。(变化后的基因必须位于基因库 bank
中)
给你两个基因序列 start
和 end
,以及一个基因库 bank
,请你找出并返回能够使 start
变化为 end
所需的最少变化次数。如果无法完成此基因变化,返回 -1
。
注意:起始基因序列 start
默认是有效的,但是它并不一定会出现在基因库中。
示例 1:
输入:start = "AACCGGTT", end = "AACCGGTA", bank = ["AACCGGTA"] 输出:1
示例 2:
输入:start = "AACCGGTT", end = "AAACGGTA", bank = ["AACCGGTA","AACCGCTA","AAACGGTA"] 输出:2
示例 3:
输入:start = "AAAAACCC", end = "AACCCCCC", bank = ["AAAACCCC","AAACCCCC","AACCCCCC"] 输出:3
提示:
start.length == 8
end.length == 8
0 <= bank.length <= 10
bank[i].length == 8
start
、end
和bank[i]
仅由字符['A', 'C', 'G', 'T']
组成
class Solution {
// 这个方法用于计算从start到end的最小突变次数
public int minMutation(String start, String end, String[] bank) {
int m = start.length(); // 基因串的长度(假设所有基因串长度相同)
int n = bank.length; // 基因库的大小
List<Integer>[] adj = new List[n]; // 建立邻接表来存储图的连接关系
for (int i = 0; i < n; i++) {
adj[i] = new ArrayList<Integer>(); // 初始化每个基因串的邻接列表
}
int endIndex = -1; // 目标基因串在基因库中的索引
for (int i = 0; i < n; i++) {
if (end.equals(bank[i])) {
endIndex = i; // 如果找到了目标基因串,记录下它的索引
}
for (int j = i + 1; j < n; j++) {
int mutations = 0; // 计算两个基因串之间的突变次数
for (int k = 0; k < m; k++) {
if (bank[i].charAt(k) != bank[j].charAt(k)) {
mutations++;
}
if (mutations > 1) {
break; // 如果突变次数超过1,则这两个基因串不能直接变换
}
}
if (mutations == 1) {
adj[i].add(j); // 如果突变次数为1,则两个基因串是相邻的
adj[j].add(i); // 添加双向连接
}
}
}
if (endIndex == -1) {
return -1; // 如果目标基因串不在基因库中,返回-1
}
Queue<Integer> queue = new ArrayDeque<Integer>(); // 用于BFS的队列
boolean[] visited = new boolean[n]; // 记录基因串是否被访问过
int step = 1; // 记录当前的步数
// 初始化队列,检查start是否可以直接突变到基因库中的任意基因串
for (int i = 0; i < n; i++) {
int mutations = 0; // 计算start与当前基因串的突变次数
for (int k = 0; k < m; k++) {
if (start.charAt(k) != bank[i].charAt(k)) {
mutations++;
}
if (mutations > 1) {
break; // 如果突变次数超过1,则不考虑这个基因串
}
}
if (mutations == 1) {
queue.offer(i); // 将符合条件的基因串加入队列
visited[i] = true; // 标记为已访问
}
}
// 使用BFS遍历图
while (!queue.isEmpty()) {
int sz = queue.size(); // 当前层的节点数量
for (int i = 0; i < sz; i++) {
int curr = queue.poll(); // 取出当前节点
if (curr == endIndex) {
return step; // 如果到达目标基因串,返回步数
}
for (int next : adj[curr]) { // 遍历当前节点的所有邻接节点
if (visited[next]) {
continue; // 如果该邻接节点已经访问过,跳过
}
visited[next] = true; // 标记为已访问
queue.offer(next); // 将邻接节点加入队列
}
}
step++; // 每完成一层的遍历,步数加1
}
return -1; // 如果无法到达目标基因串,返回-1
}
}
解题思路
-
图建模:
- 将基因串视为图的节点,每两个基因串之间如果只相差一个字符,则存在一条边连接它们。通过遍历基因库,构建图的邻接表。
-
BFS算法:
- 使用广度优先搜索(BFS)算法从起始基因串开始遍历。BFS可以保证找到的第一个到达目标的路径是最短的,因为它层层扩展,每一层代表一步变换。
-
处理边界情况:
- 如果目标基因串不在基因库中,则直接返回
-1
。
- 如果目标基因串不在基因库中,则直接返回