spark的Graphx中subGraph算法的改进

本文探讨了Spark GraphX中subGraph算法存在的问题,即返回的子图可能包含孤立点。通过对源码的分析,文章提出了改进方案,旨在优化子图提取过程,确保得到的子图不包含无连接边的节点。
摘要由CSDN通过智能技术生成

众所周知,在spark Graphx的求子图方法subgraph中,返回的子图有可能会包含孤立点,即该点无任何边:

算法源码如下所示:

override def subgraph(
    epred: EdgeTriplet[VD, ED] => Boolean = x => true,
    vpred: (VertexId, VD) => Boolean = (a, b) => true): Graph[VD, ED] = {
  vertices.cache()
  // Filter the vertices, reusing the partitioner and the index from t
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值