数据结构与算法--图相关_图计算相关的数据管理算法-CSDN博客

本文链接：https://blog.csdn.net/hixiaoxiaoniao/article/details/89702881

图

图

图中元素叫做顶点(vertex)，顶点和顶点之间的关系叫做边(edge)
有向图中，跟顶点相连接的条数叫做度(degree)
度分为入度(in-degree)和出度(out-degree)
带权图(weightd graph)，每条边都有一个权重(weight)

图的存储方式
邻接矩阵存储方法
用一个二维数组来存储元素，也就是邻接矩阵(Adjacency Matrix)
可以存储无向图，也可以存储有向图

如果存储的是稀疏图，则会很浪费空间
邻接矩阵存储方式简单，直接，因为基于数组，获取两个顶点关系时就非常高效
用邻接矩阵存储图的好处是方便计算，用邻接矩阵方式存储图，可以将很多图的运算转换成矩阵之间的运算
比如求最短路劲问题时的 Floyd-Warshall算法，是利用邻接矩阵循环相乘若干次得到结果

邻接表存储方法
针对邻接矩阵比较浪费空间的问题，另一种图的存储方式是邻接表(Adjacency List)

可以将邻接表中的链表改成平衡二叉树，如红黑树，跳表，动态有序数组等

微博的存储关系，假设需要支持下面几个操作

判断用户A是否关注了用户B
判断用户A是否是用户B的粉丝
用户A关注用户B
用户A取消关注用户B
根据用户名的首字母排序，分页获取用户的粉丝列表
根据用户名称的首字母排序，分页获取用户的关注列表

这里使用两个邻接表
一个是普通的邻接表，用来存储每个用户的关注情况
还有一个逆邻接表，用来存储用户的被关注度，即粉丝情况

邻接表，逆邻接表中的链接关系，可以改成红黑树，跳表，动态有序数组，散列表等
因为微博的用户很多，可以将邻接表，逆邻接表根据规则做分片，分配到不同机器上

图的遍历

包括深度优先搜索
广度优先搜索

public class Graph { // 无向图
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // 无向图一条边存两次
    adj[s].add(t);
    adj[t].add(s);
  }
}

广度优先搜索(BFS)

广度优先搜索(Breadth-First-Search)，简称BFS
一种地毯式的层层推进搜索策略

广度优先搜索的代码实现

public void bfs(int s, int t) {
  if (s == t) return;
  boolean[] visited = new boolean[v];
  visited[s]=true;
  Queue<Integer> queue = new LinkedList<>();
  queue.add(s);
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  while (queue.size() != 0) {
    int w = queue.poll();
   for (int i = 0; i < adj[w].size(); ++i) {
      int q = adj[w].get(i);
      if (!visited[q]) {
        prev[q] = w;
        if (q == t) {
          print(prev, s, t);
          return;
        }
        visited[q] = true;
        queue.add(q);
      }
    }
  }
}

private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
  if (prev[t] != -1 && t != s) {
    print(prev, s, prev[t]);
  }
  System.out.print(t + " ");
}

上面的代码包含了三个辅助变量 visited，queue，prev

visited，是用来记录已经被访问的顶点，用来避免重复访问
queue，是一个队列，用来存储已经被访问，但相连接的顶点还没有被访问的顶点，广度优先搜索是逐层访问的，只有把第k层的顶点都访问完之后，才能访问第k+1层的顶点
pre，用来记录搜索路径，当从顶点s开始，广度优先搜索到顶点t后，prev数组中存储的是搜索的路径，这个路径是反向存储的，比如通过顶点2的邻接表访问到顶点3，那么prev[3]就等于2

下面是广度优先搜索的执行过程

广度优先搜索的时间复杂度是O(V+E)，其中V是顶点个数，E是边的个数
因为E肯定要远大于V-1，所以广度优先搜索的时间复杂度可以简写为O(E)
空间消耗主要在几个辅助遍历visited数组，queue队列，prev数组上，他们不会超过顶点个数，
所以空间复杂度是O(V)

深度优先搜索(DFS)

深度优先搜索(Depth-First-Search)，简称DFS，最直观的列子就是走迷宫
下图是深度优先搜索的遍历方式

深度优先搜索的代码实现

boolean found = false; // 全局变量或者类成员变量

public void dfs(int s, int t) {
  found = false;
  boolean[] visited = new boolean[v];
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  recurDfs(s, t, visited, prev);
  print(prev, s, t);
}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
  if (found == true) return;
  visited[w] = true;
  if (w == t) {
    found = true;
    return;
  }
  for (int i = 0; i < adj[w].size(); ++i) {
    int q = adj[w].get(i);
    if (!visited[q]) {
      prev[q] = w;
      recurDfs(q, t, visited, prev);
    }
  }
}

从图中可以看到，每条边最多会被访问两次，一次是遍历，一次是回退
所以深度优先搜索的算法时间复杂度是O(E)，E是边的个数
内存消耗主要是在visited，prev和递归调用栈，两个数组大小跟顶点V个数成正比，
递归调用栈最大深度不会超过顶点个数，所以空间复杂度是O(V)

拓扑排序

拓扑排序用局部有序的情况下，推到出全局有序的关系
比如源文件编译
A.cpp 依赖 B.cpp
B.cpp 依赖 C.cpp
D.cpp 依赖 B.cpp

穿衣服也是局部有序，推到出全局有序

拓扑排序的基本数据结构
拓扑排序要求不能出现环依赖

public class Graph {
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // s 先于 t，边 s->t
    adj[s].add(t);
  }
}

Kahn算法

定义数据结构的时候，如果s需要先于t执行，就添加一条s指向t的边，如果某个顶点入度为0，
也就表示没有任何顶点必须先于这个顶点执行，那么这个顶点就可以执行了
先找到一个入度为0的顶点，将其输出到拓扑排序结果中(也就是打印出来)
并将这个顶点从图中删除，循环上面的过程，直到的顶点都被输出

public void topoSortByKahn() {
  int[] inDegree = new int[v]; // 统计每个顶点的入度
  for (int i = 0; i < v; ++i) {
    for (int j = 0; j < adj[i].size(); ++j) {
      int w = adj[i].get(j); // i->w
      inDegree[w]++;
    }
  }
  LinkedList<Integer> queue = new LinkedList<>();
  for (int i = 0; i < v; ++i) {
    if (inDegree[i] == 0) queue.add(i);
  }
  while (!queue.isEmpty()) {
    int i = queue.remove();
    System.out.print("->" + i);
    for (int j = 0; j < adj[i].size(); ++j) {
      int k = adj[i].get(j);
      inDegree[k]--;
      if (inDegree[k] == 0) queue.add(k);
    }
  }
}

DFS算法

应该叫深度优先遍历，遍历图中所有的顶点

public void topoSortByDFS() {
  // 先构建逆邻接表，边 s->t 表示，s 依赖于 t，t 先于 s
  LinkedList<Integer> inverseAdj[] = new LinkedList[v];
  for (int i = 0; i < v; ++i) { // 申请空间
    inverseAdj[i] = new LinkedList<>();
  }
  for (int i = 0; i < v; ++i) { // 通过邻接表生成逆邻接表
    for (int j = 0; j < adj[i].size(); ++j) {
      int w = adj[i].get(j); // i->w
      inverseAdj[w].add(i); // w->i
    }
  }
  boolean[] visited = new boolean[v];
  for (int i = 0; i < v; ++i) { // 深度优先遍历图
    if (visited[i] == false) {
      visited[i] = true;
      dfs(i, inverseAdj, visited);
    }
  }
}

private void dfs(
    int vertex, LinkedList<Integer> inverseAdj[], boolean[] visited) {
  for (int i = 0; i < inverseAdj[vertex].size(); ++i) {
    int w = inverseAdj[vertex].get(i);
    if (visited[w] == true) continue;
    visited[w] = true;
    dfs(w, inverseAdj, visited);
  } // 先把 vertex 这个顶点可达的所有顶点都打印出来之后，再打印它自己
  System.out.print("->" + vertex);
}

这个算法包括两部分
1.通过邻接表构造逆邻接表，在邻接表中，边s->t表示s先于t执行
在逆邻接表中，边s->t表示s依赖t，s后于t执行

2.算法核心，递归处理每个顶点，对于顶点vertex来说，先输出它可达的所有顶点
也就是把他依赖的所有顶点都输出了，再输出自己

Kahn和DFS深度优先搜索的时间福在读都是O(V+E)，V是顶点个数，E是边个数