Leetcode【最小基因变化】

433. 最小基因变化

基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 'A''C''G' 和 'T' 之一。

假设我们需要调查从基因序列 start 变为 end 所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。

  • 例如,"AACCGGTT" --> "AACCGGTA" 就是一次基因变化。

另有一个基因库 bank 记录了所有有效的基因变化,只有基因库中的基因才是有效的基因序列。(变化后的基因必须位于基因库 bank 中)

给你两个基因序列 start 和 end ,以及一个基因库 bank ,请你找出并返回能够使 start 变化为 end 所需的最少变化次数。如果无法完成此基因变化,返回 -1 。

注意:起始基因序列 start 默认是有效的,但是它并不一定会出现在基因库中。

示例 1:

输入:start = "AACCGGTT", end = "AACCGGTA", bank = ["AACCGGTA"]
输出:1

示例 2:

输入:start = "AACCGGTT", end = "AAACGGTA", bank = ["AACCGGTA","AACCGCTA","AAACGGTA"]
输出:2

示例 3:

输入:start = "AAAAACCC", end = "AACCCCCC", bank = ["AAAACCCC","AAACCCCC","AACCCCCC"]
输出:3

提示:

  • start.length == 8
  • end.length == 8
  • 0 <= bank.length <= 10
  • bank[i].length == 8
  • startend 和 bank[i] 仅由字符 ['A', 'C', 'G', 'T'] 组成
class Solution {
    // 这个方法用于计算从start到end的最小突变次数
    public int minMutation(String start, String end, String[] bank) {
        int m = start.length();  // 基因串的长度(假设所有基因串长度相同)
        int n = bank.length;    // 基因库的大小
        List<Integer>[] adj = new List[n];  // 建立邻接表来存储图的连接关系
        
        for (int i = 0; i < n; i++) {
            adj[i] = new ArrayList<Integer>();  // 初始化每个基因串的邻接列表
        }

        int endIndex = -1;  // 目标基因串在基因库中的索引
        for (int i = 0; i < n; i++) {
            if (end.equals(bank[i])) {
                endIndex = i;  // 如果找到了目标基因串,记录下它的索引
            }
            for (int j = i + 1; j < n; j++) {
                int mutations = 0;  // 计算两个基因串之间的突变次数
                for (int k = 0; k < m; k++) {
                    if (bank[i].charAt(k) != bank[j].charAt(k)) {
                        mutations++;
                    }
                    if (mutations > 1) {
                        break;  // 如果突变次数超过1,则这两个基因串不能直接变换
                    }
                }
                if (mutations == 1) {
                    adj[i].add(j);  // 如果突变次数为1,则两个基因串是相邻的
                    adj[j].add(i);  // 添加双向连接
                }
            }
        }

        if (endIndex == -1) {
            return -1;  // 如果目标基因串不在基因库中,返回-1
        }

        Queue<Integer> queue = new ArrayDeque<Integer>();  // 用于BFS的队列
        boolean[] visited = new boolean[n];  // 记录基因串是否被访问过
        int step = 1;  // 记录当前的步数
        
        // 初始化队列,检查start是否可以直接突变到基因库中的任意基因串
        for (int i = 0; i < n; i++) {
            int mutations = 0;  // 计算start与当前基因串的突变次数
            for (int k = 0; k < m; k++) {
                if (start.charAt(k) != bank[i].charAt(k)) {
                    mutations++;
                }
                if (mutations > 1) {
                    break;  // 如果突变次数超过1,则不考虑这个基因串
                }
            }
            if (mutations == 1) {
                queue.offer(i);  // 将符合条件的基因串加入队列
                visited[i] = true;  // 标记为已访问
            }
        }

        // 使用BFS遍历图
        while (!queue.isEmpty()) {
            int sz = queue.size();  // 当前层的节点数量
            for (int i = 0; i < sz; i++) {
                int curr = queue.poll();  // 取出当前节点
                if (curr == endIndex) {
                    return step;  // 如果到达目标基因串,返回步数
                }
                for (int next : adj[curr]) {  // 遍历当前节点的所有邻接节点
                    if (visited[next]) {
                        continue;  // 如果该邻接节点已经访问过,跳过
                    }
                    visited[next] = true;  // 标记为已访问
                    queue.offer(next);  // 将邻接节点加入队列
                }
            }
            step++;  // 每完成一层的遍历,步数加1
        }
        return -1;  // 如果无法到达目标基因串,返回-1
    }
}

解题思路

  1. 图建模

    • 将基因串视为图的节点,每两个基因串之间如果只相差一个字符,则存在一条边连接它们。通过遍历基因库,构建图的邻接表。
  2. BFS算法

    • 使用广度优先搜索(BFS)算法从起始基因串开始遍历。BFS可以保证找到的第一个到达目标的路径是最短的,因为它层层扩展,每一层代表一步变换。
  3. 处理边界情况

    • 如果目标基因串不在基因库中,则直接返回 -1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值