educoder-Spark GraphX—寻找社交媒体中的“影响力用户”

最新推荐文章于 2024-01-08 16:47:25 发布

多多读书~

最新推荐文章于 2024-01-08 16:47:25 发布

阅读量1.9k

点赞数 2

文章标签：媒体 spark 算法

本文链接：https://blog.csdn.net/qq_48664727/article/details/125181540

版权

该博客介绍了如何使用Spark GraphX的Pregel API来寻找社交媒体中的影响力用户，即出度最大的节点。在第一部分，讲解了Pregel API的基础和如何找到距离指定顶点最远的顶点。第二部分则涉及在Twitter数据中实现影响力用户的查找，通过处理用户关注关系数据，找出被关注最多的人。

摘要由CSDN通过智能技术生成

第1关：认识Pregel API

简介

Spark GraphX中提供了方便开发者的基于谷歌Pregel API的迭代算法，因此可以用Pregel的计算框架来处理Spark上的图数据。GraphX的Pregel API提供了一个简明的函数式算法设计，用它可以在图中方便的迭代计算，如最短路径、关键路径、n度关系等，也可以通过对一些内部数据集的缓存和释放缓存操作来提升性能。

编程要求

根据图1运用pregel函数找出距离Ann最远的顶点。补全代码中的内容，使得程序运行结果如预期输出。具体请参见后续测试样例。

测试说明

平台会对你编写的代码进行测试：

测试输入：
预期输出：

import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.graphx._

object farthest_distance{
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("farthest distance").setMaster(&#