岛问题
一个矩阵中只有0和1两种值,每个位置都可以和自己的上下左右四个位置相连,如果有一片1连在一起,这个部分就叫做一个岛,求一个矩阵中有多少岛?
例如:这个矩阵中就有3个岛
0 0 1 0 1 0
1 1 1 0 1 0
1 0 0 1 0 0
0 0 0 0 0 0
常规递归实现
外圈两个for循环,来遍历所有二维数组中的数据。
每遍历到一个数,我们首先判断,如果是1,就让岛的数量加1,同时调用感染函数。感染函数就是一个递归函数,递归上下左右,如果遇到1,就感染成2,否则返回。相当于,当我们遇到一个岛中第一个1时,用感染函数把整个岛全部感染成2,防止重复计算岛的数量,然后继续遍历整个二维数组,遇到2和0全部跳过继续,直到遇到下一个1的时候,再次调用感染函数。
代码实现:
int num=0;
public int getIslands(int[][] arr){
for(int i=0;i<arr.length;i++){
for(int j=0;j<arr[0].length;j++){
if(arr[i][j]==1){
num++;
infect(arr,i,j,arr.length,arr[0].length);
}
}
}
return num;
}
private void infect(int[][] arr,i,j,N,M){
if(i<0||i>=N||j<0||j>=M||arr[i][j]!=1){
return;
}else{
arr[i][j]=2;
}
infect(i+1,j,N,M);
infect(i-1,j,N,M);
infect(i,j+1,N,M);
infect(i,j-1,N,M);
}
分布式实现岛问题
如果数据量特别大,分布式的思想往往能很好的提高效率,比如岛的问题,如果规模特别大的话,是否可以分块进行呢?先将原来的二维数组分块,分块后,各个块各自进行上面的常规递归运算,最后再将各个块的结果合并。
问题:
最大的问题就是合并时的问题,比如,原来两个块各自统计出岛的数量,可是,合并后,边界部分有的地方可能会连上,这样的话,合并后岛连上了,相当于总的岛的数量应该减少1。
因此,分布式计算此问题的最大难题就合并时的问题。相当于,分布式统计时的岛就是一块块集合,然后,需要判断边界的数是否属于不同的集合还是相同的集合,如果是不同的集合,还要将岛合并在一起,也就是集合合并。这样看来,判断是否是同一个集合?合并集合?想到了什么?没错,就是并查集的标准结构嘛
并查集实现过程
1.在上面的经典岛问题中,将第一次遇到的1作为并查集的代表节点,然后,在感染函数中,所有被感染的,都作为代表节点的子节点。相当于,把每块岛中第一个被遍历到的作为代表节点构建并查集。然后,总共需要记录岛的数量、并查集的代表节点。
2.计算完每个块内的岛的数量以及并查集的代表节点,那么,合并时,相邻的两块进行合并,其实就是判断边界上所有的相邻节点。
①如果两个相邻节点都是1的话,就判断两个节点属于的并查集的代表节点,如果代表节点不相同,就合并两个并查集,同时,岛的总数-1。
②如果两个相邻节点都是1的话,判断结果时属于同一个并查集,说明之前已经合并过了。
③如果相邻两个节点至少有一个不是1,则直接跳过。