spark组件之graphx函数方法（一）

最新推荐文章于 2022-06-03 20:27:06 发布

Running_you

最新推荐文章于 2022-06-03 20:27:06 发布

阅读量2.2k

点赞数 2

分类专栏：函数 spark graphx 文章标签： spark 函数

本文链接：https://blog.csdn.net/sinat_29508201/article/details/51605676

版权

spark 同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

函数

6 篇文章 0 订阅

订阅专栏

graphx

5 篇文章 0 订阅

订阅专栏

aggregateMessages

类graph提供了聚合方法aggregateMessages，关于使用方法官方给出了具体的案例参考：

// Import random graph generation library
import org.apache.spark.graphx.util.GraphGenerators
// Create a graph with "age" as the vertex property.  Here we use a random graph for simplicity.
val graph: Graph[Double, Int] =
  GraphGenerators.logNormalGraph(sc, numVertices = 100).mapVertices( (id, _) => id.toDouble )
// Compute the number of older followers and their total age
val olderFollowers: VertexRDD[(Int, Double)] = graph.aggregateMessages[(Int, Double)](
  triplet => { // Map Function
    if (triplet.srcAttr > triplet.dstAttr) {
      // Send message to destination vertex containing counter and age
      triplet.sendToDst(1, triplet.srcAttr)
    }
  },
  // Add counter and age
  (a, b) => (a._1 + b._1, a._2 + b._2) // Reduce Function
)

不过为了更清晰的理解该方法的使用方式，故采用更简单的代码实践以供理解：
1，随机产生图的数据集；

val graph=
GraphGenerators.logNormalGraph(sc, numVertices = 100).mapVertices( (id, _) => id.toDouble )

为了定位函数效果，选取srcId=80的点，数据如下图所示：
这里写图片描述

2，利用aggregateMessages方法计算以srcId=80为源点的邻居点的个数和总和，主要掌握sendToDst和sendToSrc方法的特点，前者是以dst为聚集点，后者则是以src为聚集点，方法定义如下；

val olderFollower=graph.aggregateMessages[(Int, Double)](
      e => e.sendToSrc(1,e.dstAttr),
      (a, b) => (a._1 + b._1, a._2 + b._2) )

之后查看srcId=80的聚合效果如下图所示：
这里写图片描述

3.若是在定义aggregateMessages使用sendToDst方法时，如下：

val olderFollowers=graph.aggregateMessages[(Int, Double)](
      e => e.sendToDst(1,e.srcAttr),
      (a, b) => (a._1 + b._1, a._2 + b._2) )

原始数据如下所示：
这里写图片描述
则效果如下图所示：

Running_you

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录