LeetCode岛屿数量（DFS）

置顶努力的leon...

已于 2023-02-05 11:52:16 修改

阅读量662

点赞数 2

文章标签：深度优先算法图论 Powered by 金山文档

于 2023-02-05 00:56:28 首次发布

本文链接：https://blog.csdn.net/weixin_54453878/article/details/128886724

版权

这是我的第一篇CSDN博客，有感于在力扣上遇到的一道算法题（200.岛屿数量），思来想去写出这篇博客。

我们首先明确一下岛屿问题中的网格结构是如何定义的，以方便后面的讨论。

网格问题是由 m×n 个小方格组成一个网格，每个小方格与其上下左右四个方格认为是相邻的，要在这样的网格上进行某种搜索。

岛屿问题可以理解为一类网格问题。每个格子中的数字可能是 0 或者 1。我们把数字为 0（蓝色块）的格子看成海洋格子，数字为 1（棕色块）的格子看成陆地格子，这样相邻的陆地格子就连接成一个岛屿，而题目的要求就是找出岛屿的数量（我的理解是在由‘0’和‘1’，组成的矩阵中，若数字‘1’上下左右相邻，则可以看作一整块岛屿，默认边界为海洋，即树阵中至少有一块岛屿，问题为在树阵中找出共有多少块连在一起的‘1’块即岛屿）。同样岛屿问题可以演化各种岛屿问题的变种，包括岛屿的数量、面积（‘1’块的个数）、周长（‘1’块的边界长度等）等。不过这些问题，基本都可以用（深度有限算法）DFS 遍历来解决。

代码样板：

class Solution {
public:
    int numIslands(vector<vector<char>>& grid) {
        
    }
};

第一次接触DFS是利用深度优先算法求求无向图的连通分量。

void DFS(Graph G，int v){       //从无向图G顶点v出发，深度优先遍历G
    visit(v);                  //visit()为访问节点v的函数
    visited[v]=true;      //避免重复遍历，visited[]数组用于记录该顶点是否被访问
    w=Firstnei(G,v);           //Firstnei()为求图G中顶点v的第一个邻接顶点
    while(w<n){           //判断跳出情况，n可以理解为图G中顶点个数，w为顶点标号（0~n-1）
        if(!visited[w])        //w为尚未访问的邻接顶点
            DFS(G,w);     //访问相邻顶点
        w=Nextnei(G,v,w);      //Nextnei()为求图G中顶点v的除w外的下一个邻接顶点
    }          
}

解决这个问题的两个要看清三个要素。第一个要素是访问相邻结点，我们的 DFS 遍历要访问的节点是原始顶点在无向图中的未被访问过的相邻顶点，是否相邻在于抽象的无向图中两顶点之间是否有连线。那么，回归本题，网格结构中的格子的相邻顶点或者说有多少相邻结点？答案是上下左右四个。对于格子 (r, c) 来说（r 和 c 分别代表行坐标和列坐标），四个相邻的格子分别是 (r-1, c)、(r+1, c)、(r, c-1)、(r, c+1)。

第二个要素是判断跳出情况，一般来说，求连通分量的跳出情况为w==n，这样一个条件判断其实有两个含义：一方面，这表示w==n表示已经将所有的可能有顶点v连通的顶点排查完，结束本轮DFS。另一方面，在 w==n 的时候及时返回，返回到当前v作为上一顶点的w的DFS遍历中，继续进行上一顶点v的DFS遍历。对于网格上的 DFS，我们完全可以无向图的 DFS，写出网格 DFS 的第两个要素：应该是网格中不需要继续遍历、grid[r][c] 会出现数组下标越界异常的格子，也就是那些超出网格范围的格子。甭管当前是在哪个格子，先往四个方向走一步再说，如果发现走出了网格范围再赶紧返回。这跟无向图的遍历方法是一样的，先递归调用，发现w==n（到达边界）再返回。

第三个要素避免重复遍历，无向图的解决方法是单独设置一个bool型visited[]，初值为false，数组用于判断每个顶点是否遍历过，在进行dfs（）函数前，判断当前的节点对应的数组值是否为true，即已经遍历过，以此来避免重复遍历。网格结构的 DFS 与无向图的 DFS 很相似，遍历中可能遇到遍历过的结点。这是因为，网格结构本质上是一个图，我们可以把每个格子看成图中的结点，每个结点有向上下左右的四条边。在图中遍历时，自然可能遇到重复遍历结点，这时候，DFS 可能会不停地兜圈子，永远停不下来。在网络结构如何避免这样的重复遍历呢？类似地，标记已经遍历过的格子。不同的是，网络树阵上的元素值可以改变以赋予其新的意义。以岛屿问题为例，我们需要在所有值为 1 的陆地格子上做 DFS 遍历。每走过一个陆地格子，就把格子的值改为 2，这样当我们遇到 2 的时候，就知道这是遍历过的格子了。也就是说，每个格子可能取三个值：

0 —— 海洋格子

1 —— 陆地格子（未遍历过）

2 —— 陆地格子（已遍历过）

将DFS遍历过的元素由'1'置'2',便可以避免重复遍历。

根据前三个要素，我们得到了网格DFS的框架代码：

    bool isArea(vector<vector<char>>& grid,int i,int j){是
        return i>=0&&j>=0&&i<grid.size()&&j<grid[0].size();
    }                                // 判断坐标 (r, c) 是否在网格中
    void dfs(vector<vector<char>>& grid,int i,int j){
        if(!isArea(grid,i,j))        //判断跳出条件
            return;
        if(grid[i][j]!='1')          // 如果这个格子不是岛屿，直接返回
            return;
        grid[i][j]='2';              // 将格子标记为已遍历过
        dfs(grid,i-1,j);             // 访问上、下、左、右四个相邻结点
        dfs(grid,i+1,j);
        dfs(grid,i,j-1);
        dfs(grid,i,j+1);
    }

在框架代码之外，我们在dfs()函数外添加调用函数numIslands()，通过计数调用从numIslands()函数中调用了多少次dfs()，便可以得到岛屿的数量num。整体代码：

class Solution {
public:
    bool isArea(vector<vector<char>>& grid,int i,int j){
        return i>=0&&j>=0&&i<grid.size()&&j<grid[0].size();
    }
    void dfs(vector<vector<char>>& grid,int i,int j){
        if(!isArea(grid,i,j))
            return;
        if(grid[i][j]!='1')
            return;
        grid[i][j]='2';
        dfs(grid,i-1,j);
        dfs(grid,i+1,j);
        dfs(grid,i,j-1);
        dfs(grid,i,j+1);
    }
    int numIslands(vector<vector<char>>& grid) {
        int sum=0;
        for(int i=0;i<grid.size();i++)
            for(int j=0;j<grid[0].size();j++)
                if(grid[i][j]=='1'){
                    dfs(grid,i,j);
                    sum++;
                }
        return sum;
    }
};

这样，我们就得到了一个岛屿问题、乃至各种网格问题的通用 DFS 遍历方法。但是，在一些题解中，可能会把已遍历过的陆地格子标记为和海洋格子一样的 0，美其名曰陆地沉没方法，即遍历完一个陆地格子就让陆地沉没为海洋。这种方法看似很巧妙，但实际上有很大隐患，因为这样我们就无法区分海洋格子和已遍历过的陆地格子了。如果题目更复杂一点，这很容易出 bug。