这是我的第一篇CSDN博客,有感于在力扣上遇到的一道算法题(200.岛屿数量),思来想去写出这篇博客。
我们首先明确一下岛屿问题中的网格结构是如何定义的,以方便后面的讨论。
网格问题是由 m×n 个小方格组成一个网格,每个小方格与其上下左右四个方格认为是相邻的,要在这样的网格上进行某种搜索。
![](https://img-blog.csdnimg.cn/img_convert/28c3715ee526fbcc6e316b77a71b43cc.png)
岛屿问题可以理解为一类网格问题。每个格子中的数字可能是 0 或者 1。我们把数字为 0(蓝色块) 的格子看成海洋格子,数字为 1(棕色块) 的格子看成陆地格子,这样相邻的陆地格子就连接成一个岛屿,而题目的要求就是找出岛屿的数量(我的理解是在由‘0’和‘1’,组成的矩阵中,若数字‘1’上下左右相邻,则可以看作一整块岛屿,默认边界为海洋,即树阵中至少有一块岛屿,问题为在树阵中找出共有多少块连在一起的‘1’块即岛屿)。同样岛屿问题可以演化各种岛屿问题的变种,包括岛屿的数量、面积(‘1’块的个数)、周长(‘1’块的边界长度等)等。不过这些问题,基本都可以用 (深度有限算法)DFS 遍历来解决。
代码样板:
class Solution {
public:
int numIslands(vector<vector<char>>& grid) {
}
};
第一次接触DFS是利用深度优先算法求求无向图的连通分量。
void DFS(Graph G,int v){ //从无向图G顶点v出发,深度优先遍历G
visit(v); //visit()为访问节点v的函数
visited[v]=true; //避免重复遍历,visited[]数组用于记录该顶点是否被访问
w=Firstnei(G,v); //Firstnei()为求图G中顶点v的第一个邻接顶点
while(w<n){ //判断跳出情况,n可以理解为图G中顶点个数,w为顶点标号(0~n-1)
if(!visited[w]) //w为尚未访问的邻接顶点
DFS(G,w); //访问相邻顶点
w=Nextnei(G,v,w); //Nextnei()为求图G中顶点v的除w外的下一个邻接顶点
}
}
解决这个问题的两个要看清三个要素。第一个要素是访问相邻结点,我们的 DFS 遍历要访问的节点是原始顶点在无向图中的未被访问过的相邻顶点,是否相邻在于抽象的无向图中两顶点之间是否有连线。那么,回归本题,网格结构中的格子的相邻顶点或者说有多少相邻结点?答案是上下左右四个。对于格子 (r, c) 来说(r 和 c 分别代表行坐标和列坐标),四个相邻的格子分别是 (r-1, c)、(r+1, c)、(r, c-1)、(r, c+1)。
第二个要素是判断跳出情况,一般来说,求连通分量的跳出情况为w==n,这样一个条件判断其实有两个含义:一方面,这表示w==n表示已经将所有的可能有顶点v连通的顶点排查完,结束本轮DFS。另一方面,在 w==n 的时候及时返回,返回到当前v作为上一顶点的w的DFS遍历中,继续进行上一顶点v的DFS遍历。对于网格上的 DFS,我们完全可以无向图的 DFS,写出网格 DFS 的第两个要素:应该是网格中不需要继续遍历、grid[r][c] 会出现数组下标越界异常的格子,也就是那些超出网格范围的格子。甭管当前是在哪个格子,先往四个方向走一步再说,如果发现走出了网格范围再赶紧返回。这跟无向图的遍历方法是一样的,先递归调用,发现w==n(到达边界)再返回。
第三个要素避免重复遍历,无向图的解决方法是单独设置一个bool型visited[],初值为false,数组用于判断每个顶点是否遍历过,在进行dfs()函数前,判断当前的节点对应的数组值是否为true,即已经遍历过,以此来避免重复遍历。网格结构的 DFS 与无向图的 DFS 很相似,遍历中可能遇到遍历过的结点。这是因为,网格结构本质上是一个图,我们可以把每个格子看成图中的结点,每个结点有向上下左右的四条边。在图中遍历时,自然可能遇到重复遍历结点,这时候,DFS 可能会不停地兜圈子,永远停不下来。在网络结构如何避免这样的重复遍历呢?类似地,标记已经遍历过的格子。不同的是,网络树阵上的元素值可以改变以赋予其新的意义。以岛屿问题为例,我们需要在所有值为 1 的陆地格子上做 DFS 遍历。每走过一个陆地格子,就把格子的值改为 2,这样当我们遇到 2 的时候,就知道这是遍历过的格子了。也就是说,每个格子可能取三个值:
0 —— 海洋格子
1 —— 陆地格子(未遍历过)
2 —— 陆地格子(已遍历过)
将DFS遍历过的元素由'1'置'2',便可以避免重复遍历。
根据前三个要素,我们得到了网格DFS的框架代码:
bool isArea(vector<vector<char>>& grid,int i,int j){是
return i>=0&&j>=0&&i<grid.size()&&j<grid[0].size();
} // 判断坐标 (r, c) 是否在网格中
void dfs(vector<vector<char>>& grid,int i,int j){
if(!isArea(grid,i,j)) //判断跳出条件
return;
if(grid[i][j]!='1') // 如果这个格子不是岛屿,直接返回
return;
grid[i][j]='2'; // 将格子标记为已遍历过
dfs(grid,i-1,j); // 访问上、下、左、右四个相邻结点
dfs(grid,i+1,j);
dfs(grid,i,j-1);
dfs(grid,i,j+1);
}
在框架代码之外,我们在dfs()函数外添加调用函数numIslands(),通过计数调用从numIslands()函数中调用了多少次dfs(),便可以得到岛屿的数量num。整体代码:
class Solution {
public:
bool isArea(vector<vector<char>>& grid,int i,int j){
return i>=0&&j>=0&&i<grid.size()&&j<grid[0].size();
}
void dfs(vector<vector<char>>& grid,int i,int j){
if(!isArea(grid,i,j))
return;
if(grid[i][j]!='1')
return;
grid[i][j]='2';
dfs(grid,i-1,j);
dfs(grid,i+1,j);
dfs(grid,i,j-1);
dfs(grid,i,j+1);
}
int numIslands(vector<vector<char>>& grid) {
int sum=0;
for(int i=0;i<grid.size();i++)
for(int j=0;j<grid[0].size();j++)
if(grid[i][j]=='1'){
dfs(grid,i,j);
sum++;
}
return sum;
}
};
这样,我们就得到了一个岛屿问题、乃至各种网格问题的通用 DFS 遍历方法。但是,在一些题解中,可能会把已遍历过的陆地格子标记为和海洋格子一样的 0,美其名曰陆地沉没方法,即遍历完一个陆地格子就让陆地沉没为海洋。这种方法看似很巧妙,但实际上有很大隐患,因为这样我们就无法区分海洋格子和已遍历过的陆地格子了。如果题目更复杂一点,这很容易出 bug。