一些算法的MapReduce实现——图的BFS遍历

最新推荐文章于 2024-07-15 17:29:31 发布

joeywen

最新推荐文章于 2024-07-15 17:29:31 发布

阅读量7.9k

点赞数 3

分类专栏：一些算法的MapReduce实现一些算法的MapReduce实现文章标签： mapreduce BFS 广度优先遍历

本文链接：https://blog.csdn.net/wzhg0508/article/details/18091035

版权

本文介绍了如何使用MapReduce实现图的广度优先遍历（BFS）。从BFS简介开始，详细阐述了MapReduce在处理过程中涉及的InputFormat、中间输出阶段以及最终输出。同时，提到了关键的Node.java、TraverseGraph.java和Driver.java类，以及BaseDriver.java作为驱动程序的角色。通过这种方法，可以在大规模数据集上高效地进行图的遍历。

摘要由CSDN通过智能技术生成

Breadth-first search 简介

BFS算法伪代码如下[1]

BFS(G, s)
  for each vertex u ∈ V [G] - {s}
       do color[u] ← WHITE
          d[u] ← ∞
          π[u] ← NIL
  //除了源顶点s之外，第1-4行置每个顶点为白色，置每个顶点u的d[u]为无穷大，
  //置每个顶点的父母为NIL。
  color[s] ← GRAY
  //第8行，将源顶点s置为灰色，这是因为在过程开始时，源顶点已被发现。
  d[s] ← 0       //将d[s]初始化为0。
  π[s] ← NIL     //将源顶点的父顶点置为NIL。
  Q ← Ø
  ENQUEUE(Q, s)                  //入队
  //第12、13行，初始化队列Q，使其仅含源顶点s。
  while Q ≠ Ø
      do u ← DEQUEUE(Q)    //出队
  //第16行，确定队列头部Q头部的灰色顶点u，并将其从Q中去掉。
         for each v ∈ Adj[u]        //for循环考察u的邻接表中的每个顶点v
             do if color[v] = WHITE
                   then color[v] ← GRAY     //置为灰色
                        d[v] ← d[u] + 1     //距离被置为d[u]+1
                        π[v] ← u            //u记为该顶点的父母
                        ENQUEUE(Q, v)        //插入队列中
         color[u] ← BLACK      //u 置为黑色

具体流程图如下：

MapReduce实现BFS

假设有一个无向图，如下：

每一条边的权重设为1

InputFormat

source<tab>adjacency_list|distance_from_the_source|color|parentNode

根据上图，输入数据为：

1<tab>2,3|0|GRAY|source
2<tab>1,3,4,5|Integer.MAX_VALUE|WHITE|null
3<tab>1,4,2|Integer.MAX_VALUE|WHITE|null
4<tab>2,3|Integer.MAX_VALUE|WHITE|null
5<tab>2|Integer.MAX_VALUE|WHITE|null

利用上面的数据，指定3个reducer对其进行处理，从开始的算法简介可以看出，不是一步MapReduce过程就可以把整个graph遍历一遍的，这需要迭代，也就需要多次运行MapReduce过程，直到所有的节点都被访问过，也就是节点的颜色都被标记为黑色，就退出。

MapReduce给我们提供了一些方法可以查看每一步MRJob运行过后的中间结果。

Intermediate output 1:

Intermediate output 2:

Reducer 1: (part-r-00000)

2<tab>1,3,4,5,|1|BLACK|1
5<tab>2,|2|GRAY|2

Reducer 2: (part-r-00001)

3<tab>1,4,2,|1|BLACK|1

Reducer 3: (part-r-00002)

1<tab>2,3,|0|BLACK|source
4<tab>2,3,|2|GRAY|2