图的搜索算法,可以理解为在图中找出一个顶点出发,到另一个顶点的路径。
首先,图的代码实现:
public class Graph { // 无向图
private int v; // 顶点的个数
private LinkedList<Integer> adj[]; // 邻接表
public Graph(int v) {
this.v = v;
adj = new LinkedList[v];
for (int i=0; i<v; ++i) {
adj[i] = new LinkedList<>();
}
}
public void addEdge(int s, int t) { // 无向图一条边存两次
adj[s].add(t);
adj[t].add(s);
}
}
一、广度优先搜索(BFS Breadth-First-Search)
地毯式层层推进的搜索策略,依次向外搜索:
public void bfs(int s, int t) {//s表示起始顶点,t表示终止顶点,求最短路径
if (s == t) return;
boolean[] visited = new boolean[v];
visited[s]=true;
Queue<Integer> queue = new LinkedList<>();
queue.add(s);
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
while (queue.size() != 0) {
int w = queue.poll();
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
if (q == t) {
print(prev, s, t);
return;
}
visited[q] = true;
queue.add(q);
}
}
}
}
private void print(int[] prev, int s, int t) { // 递归打印s->t的路径
if (prev[t] != -1 && t != s) {
print(prev, s, prev[t]);
}
System.out.print(t + " ");
}
其中三个辅助变量:
visited:记录已经被访问的顶点,用来避免顶点被重复访问。
queue:一个队列,用来存储已经被访问,但相连的顶点还没被访问的顶点。比如访问第k层顶点之后,要把他们记录下来,稍后再通过他们来找第k+1层顶点;
prev:记录搜索路径,反向存储,比如prev[w]存储的是顶点w是从哪个前驱顶点遍历过来的。
时间复杂度:最坏情况下,终止点离起始点很远,需要遍历整个图才能找到,这是每个顶点都要进出一次队列,每个边也会被访问一次,时间复杂度为
O
(
V
+
E
)
O(V+E)
O(V+E)。对于一个连通图(图中所有顶点都是连通的),E大于V-1,所以广度优先搜索的时间复杂度可以简写为
O
(
E
)
O(E)
O(E)。
空间复杂度:上述三个存储空间queue, visited, prev都不超过顶点个数,因此空间复杂度为
O
(
V
)
O(V)
O(V)。
二、深度优先搜索(DFS Depth-First-Search)
深度优先搜索类似走迷宫,下图中,搜索的起始点是s,终点是t,遇到走不通的情况就回退。深度优先搜索应用回溯思想,适合用递归的方法来实现。
boolean found = false; // 全局变量或者类成员变量
public void dfs(int s, int t) {
found = false;
boolean[] visited = new boolean[v];
int[] prev = new int[v];
for (int i = 0; i < v; ++i) {
prev[i] = -1;
}
recurDfs(s, t, visited, prev);
print(prev, s, t);
}
private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
if (found == true) return;
visited[w] = true;
if (w == t) {
found = true;
return;
}
for (int i = 0; i < adj[w].size(); ++i) {
int q = adj[w].get(i);
if (!visited[q]) {
prev[q] = w;
recurDfs(q, t, visited, prev);
}
}
}
除了使用prev, visited, print()之外,还用到found变量,当已经找到终止顶点t后,就不再继续查找了。
时间复杂度:每条边最多被访问两次,遍历和回退,因此时间复杂度为
O
(
E
)
O(E)
O(E);
空间复杂度:除了visited和prev数组大小跟顶点个数V成正比外,递归调用栈最大深度不会超过顶点个数,因此总空间复杂度为
O
(
V
)
O(V)
O(V)。