基于图结构高性能计算框架:GraphLab

本文介绍了CMU的GraphLab框架,一个用于机器学习和数据挖掘的分布式计算框架,强调其在图结构计算、异步迭代计算、动态计算和序列化能力方面的优势。与MapReduce等传统框架相比,GraphLab在处理数据关联性和算法效率上有显著提升。文中通过与Hadoop、Pregel和MPI的性能比较,展示了GraphLab在云环境中的高效表现。
摘要由CSDN通过智能技术生成

偶然觉得有必要关注下大规模机器学习和数据挖掘方法

刚阅读完 CMU的一篇《Distributed GraphLab;A Framework for Machine Learning and Data Mining in the Cloud》论文,虽然自己还木有分布式计算框架的经验,但还是想在这里抛砖引玉,望路过的大大们不吝啬赐教。自己开通博客,一方面记录并分享所学的东西,另一方面自己还是菜鸟,有讨论才能进不。


文章的摘要部分就说明了,高性能数据并行框架,像MapReduce,简化了大规模数据处理系统的设计和执行过程,但是他们没有很好的支持许多重要的数据挖掘和机器学习算法,会导致降低学习系统的效率。GraphLab框架是种基于图结构,拥有异步迭代计算,动态计算,很好序列化等特点。

CMU的GraphLab小组把GraphLab部署在Amazon的EC2云平台,并跟几个主流的大规模数据处理框架进行PK。在文章中主要有以下几点分析:


1,概括了机器学习和数据挖掘算法的共有特性和现有的大规模计算框架的局限性。

2,实现了GraphLab架构和具有分布式能力的执行模块

3,两个具有分布式执行模块:Chromatic Engine:实现部分异步数据处理

                                                      Locking Engine :能够实现完全异步数据处理

4,容错分析

5,通过部署GraphLab在EC2平台上,和Hadoop,Pregel,MPI进行性能比较,评估GraphLab的表现

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值