- 博客(42)
- 资源 (4)
- 收藏
- 关注
转载 Spark入门实战系列--9.Spark图计算GraphX介绍及实例
注】该系列文章以及使用到安装包/测试数据 可以在《倾情大奉送--Spark入门实战系列》获取 1、GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。 众所周知·,社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等
2016-02-02 20:50:35
1909
转载 Apache Spark探秘:多进程模型还是多线程模型?
Apache Spark的高性能一定程度上取决于它采用的异步并发模型(这里指server/driver端采用的模型),这与Hadoop 2.0(包括YARN和MapReduce)是一致的。Hadoop 2.0自己实现了类似Actor的异步并发模型,实现方式是epoll+状态机,而Apache Spark则直接采用了开源软件Akka,该软件实现了Actor模型,性能非常高。尽管二者在server端采
2016-02-02 19:34:28
804
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人