近似直径算法的 GraphChi 实现

最新推荐文章于 2024-05-10 09:33:56 发布

置顶

SunliyMonkey

最新推荐文章于 2024-05-10 09:33:56 发布

阅读量2.6k

点赞数 1

分类专栏：一一『图计算』文章标签： GraphChi 图计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SunliyMonkey/article/details/47983349

版权

本文介绍了 GraphChi 框架，一种针对大规模图计算的单机解决方案，利用并行滑动窗口技术减少硬盘访问延迟。文章详细讲解了其编程模型，并探讨了近似直径算法，通过 Multiple BFS 方法降低计算开销。在 GraphChi 中，选取特定节点进行 BFS，通过状态标记优化路径检查，但实际实现中存在入边和出边权值同步问题，需要额外处理。

摘要由CSDN通过智能技术生成

1. GraphChi

1.1 简介

　　GraphChi 是由卡耐基梅隆大学设计，可以在单机上进行高效大规模计算的框架，区别于将图的信息全部存储在内存当中， GraphChi 利用单机计算机海量的硬盘进行存储，由于硬盘与内存的访问速度差距很大，为了弥补使用硬盘存储带来的缺陷，他们设计出并行滑动窗口技术，用来减少硬盘的随机读写。

1.2 并行滑动窗口技术

　　将整个图谱划按照点的顺序分成不同的分片，每个分片能够完全在内存中进行
处理。如下图所示：
这里写图片描述

　　对每个分片中的入边按照源点进行排序，基于这种原则出边分布在所有的分片
上，而且占据一段连续的空间。这样对于数据的更新，首先在内存中进行计算和
存储，随后连续的写入其他分片中，这样能够很好解决随机读写带来的高延迟
问题，如下图所示。
这里写图片描述

1.3 编程模型

　　GraphChi 延续了 GraphLab 中采用的以点为中心的编程模型，针对图谱中的节点和边都携带有用户自定义的数据。在每一次迭代中，同一个分片中被标记过的点并行调用update 函数进行数据更新：获取该点入边携带的信息，出边携带的信息，该点携带的信息，通过用户自定义的计算逻辑，对边和

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。