数据结构与算法--图相关

目录

图的遍历

广度优先搜索(BFS)

深度优先搜索(DFS)

拓扑排序

Kahn算法

DFS算法


 

图中元素叫做顶点(vertex),顶点和顶点之间的关系叫做边(edge)
有向图中,跟顶点相连接的条数叫做度(degree)
度分为入度(in-degree)和出度(out-degree)
带权图(weightd graph),每条边都有一个权重(weight)

 

图的存储方式
邻接矩阵存储方法
用一个二维数组来存储元素,也就是邻接矩阵(Adjacency Matrix)
可以存储无向图,也可以存储有向图

如果存储的是稀疏图,则会很浪费空间
邻接矩阵存储方式简单,直接,因为基于数组,获取两个顶点关系时就非常高效
用邻接矩阵存储图的好处是方便计算,用邻接矩阵方式存储图,可以将很多图的运算转换成矩阵之间的运算
比如求最短路劲问题时的 Floyd-Warshall算法,是利用邻接矩阵循环相乘若干次得到结果

邻接表存储方法
针对邻接矩阵比较浪费空间的问题,另一种图的存储方式是 邻接表(Adjacency List)

可以将邻接表中的链表改成平衡二叉树,如红黑树,跳表,动态有序数组等

微博的存储关系,假设需要支持下面几个操作

  • 判断用户A是否关注了用户B
  • 判断用户A是否是用户B的粉丝
  • 用户A关注用户B
  • 用户A取消关注用户B
  • 根据用户名的首字母排序,分页获取用户的粉丝列表
  • 根据用户名称的首字母排序,分页获取用户的关注列表

这里使用两个邻接表
一个是普通的邻接表,用来存储每个用户的关注情况
还有一个逆邻接表,用来存储用户的被关注度,即粉丝情况

邻接表,逆邻接表中的链接关系,可以改成红黑树,跳表,动态有序数组,散列表等
因为微博的用户很多,可以将邻接表,逆邻接表根据规则做分片,分配到不同机器上

 

图的遍历

包括深度优先搜索
广度优先搜索

public class Graph { // 无向图
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // 无向图一条边存两次
    adj[s].add(t);
    adj[t].add(s);
  }
}

 

广度优先搜索(BFS)

广度优先搜索(Breadth-First-Search),简称BFS
一种地毯式的层层推进搜索策略

广度优先搜索的代码实现

public void bfs(int s, int t) {
  if (s == t) return;
  boolean[] visited = new boolean[v];
  visited[s]=true;
  Queue<Integer> queue = new LinkedList<>();
  queue.add(s);
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  while (queue.size() != 0) {
    int w = queue.poll();
   for (int i = 0; i < adj[w].size(); ++i) {
      int q = adj[w].get(i);
      if (!visited[q]) {
        prev[q] = w;
        if (q == t) {
          print(prev, s, t);
          return;
        }
        visited[q] = true;
        queue.add(q);
      }
    }
  }
}

private void print(int[] prev, int s, int t) { // 递归打印 s->t 的路径
  if (prev[t] != -1 && t != s) {
    print(prev, s, prev[t]);
  }
  System.out.print(t + " ");
}

上面的代码包含了三个辅助变量 visited,queue,prev

  • visited,是用来记录已经被访问的顶点,用来避免重复访问
  • queue,是一个队列,用来存储已经被访问,但相连接的顶点还没有被访问的顶点,广度优先搜索是逐层访问的,只有把第k层的顶点都访问完之后,才能访问第k+1层的顶点
  • pre,用来记录搜索路径,当从顶点s开始,广度优先搜索到顶点t后,prev数组中存储的是搜索的路径,这个路径是反向存储的,比如通过顶点2的邻接表访问到顶点3,那么prev[3]就等于2

下面是广度优先搜索的执行过程

广度优先搜索的时间复杂度是O(V+E),其中V是顶点个数,E是边的个数
因为E肯定要远大于V-1,所以广度优先搜索的时间复杂度可以简写为O(E)
空间消耗主要在几个辅助遍历visited数组,queue队列,prev数组上,他们不会超过顶点个数,
所以空间复杂度是O(V)

 

深度优先搜索(DFS)

深度优先搜索(Depth-First-Search),简称DFS,最直观的列子就是走迷宫
下图是深度优先搜索的遍历方式

深度优先搜索的代码实现

boolean found = false; // 全局变量或者类成员变量

public void dfs(int s, int t) {
  found = false;
  boolean[] visited = new boolean[v];
  int[] prev = new int[v];
  for (int i = 0; i < v; ++i) {
    prev[i] = -1;
  }
  recurDfs(s, t, visited, prev);
  print(prev, s, t);
}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
  if (found == true) return;
  visited[w] = true;
  if (w == t) {
    found = true;
    return;
  }
  for (int i = 0; i < adj[w].size(); ++i) {
    int q = adj[w].get(i);
    if (!visited[q]) {
      prev[q] = w;
      recurDfs(q, t, visited, prev);
    }
  }
}

从图中可以看到,每条边最多会被访问两次,一次是遍历,一次是回退
所以深度优先搜索的算法时间复杂度是O(E),E是边的个数
内存消耗主要是在visited,prev和递归调用栈,两个数组大小跟顶点V个数成正比,
递归调用栈最大深度不会超过顶点个数,所以空间复杂度是O(V)

 

 

拓扑排序

拓扑排序用局部有序的情况下,推到出全局有序的关系
比如源文件编译
A.cpp 依赖 B.cpp
B.cpp 依赖 C.cpp
D.cpp 依赖 B.cpp

穿衣服也是局部有序,推到出全局有序

拓扑排序的基本数据结构
拓扑排序要求不能出现环依赖

public class Graph {
  private int v; // 顶点的个数
  private LinkedList<Integer> adj[]; // 邻接表

  public Graph(int v) {
    this.v = v;
    adj = new LinkedList[v];
    for (int i=0; i<v; ++i) {
      adj[i] = new LinkedList<>();
    }
  }

  public void addEdge(int s, int t) { // s 先于 t,边 s->t
    adj[s].add(t);
  }
}

Kahn算法

定义数据结构的时候,如果s需要先于t执行,就添加一条s指向t的边,如果某个顶点入度为0,
也就表示没有任何顶点必须先于这个顶点执行,那么这个顶点就可以执行了
先找到一个入度为0的顶点,将其输出到拓扑排序结果中(也就是打印出来)
并将这个顶点从图中删除,循环上面的过程,直到的顶点都被输出

public void topoSortByKahn() {
  int[] inDegree = new int[v]; // 统计每个顶点的入度
  for (int i = 0; i < v; ++i) {
    for (int j = 0; j < adj[i].size(); ++j) {
      int w = adj[i].get(j); // i->w
      inDegree[w]++;
    }
  }
  LinkedList<Integer> queue = new LinkedList<>();
  for (int i = 0; i < v; ++i) {
    if (inDegree[i] == 0) queue.add(i);
  }
  while (!queue.isEmpty()) {
    int i = queue.remove();
    System.out.print("->" + i);
    for (int j = 0; j < adj[i].size(); ++j) {
      int k = adj[i].get(j);
      inDegree[k]--;
      if (inDegree[k] == 0) queue.add(k);
    }
  }
}

 

DFS算法

应该叫深度优先遍历,遍历图中所有的顶点

public void topoSortByDFS() {
  // 先构建逆邻接表,边 s->t 表示,s 依赖于 t,t 先于 s
  LinkedList<Integer> inverseAdj[] = new LinkedList[v];
  for (int i = 0; i < v; ++i) { // 申请空间
    inverseAdj[i] = new LinkedList<>();
  }
  for (int i = 0; i < v; ++i) { // 通过邻接表生成逆邻接表
    for (int j = 0; j < adj[i].size(); ++j) {
      int w = adj[i].get(j); // i->w
      inverseAdj[w].add(i); // w->i
    }
  }
  boolean[] visited = new boolean[v];
  for (int i = 0; i < v; ++i) { // 深度优先遍历图
    if (visited[i] == false) {
      visited[i] = true;
      dfs(i, inverseAdj, visited);
    }
  }
}

private void dfs(
    int vertex, LinkedList<Integer> inverseAdj[], boolean[] visited) {
  for (int i = 0; i < inverseAdj[vertex].size(); ++i) {
    int w = inverseAdj[vertex].get(i);
    if (visited[w] == true) continue;
    visited[w] = true;
    dfs(w, inverseAdj, visited);
  } // 先把 vertex 这个顶点可达的所有顶点都打印出来之后,再打印它自己
  System.out.print("->" + vertex);
}

这个算法包括两部分
1.通过邻接表构造逆邻接表,在邻接表中,边s->t表示s先于t执行
在逆邻接表中,边s->t表示s依赖t,s后于t执行

2.算法核心,递归处理每个顶点,对于顶点vertex来说,先输出它可达的所有顶点
也就是把他依赖的所有顶点都输出了,再输出自己

Kahn和DFS深度优先搜索的 时间福在读都是O(V+E),V是顶点个数,E是边个数

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值