spark
tianbianlan
这个作者很懒,什么都没留下…
展开
-
RDD初探
RDD初探 @20150422 RDD(resilient distributed dataset )是Spark提出的一个创新性的概念,它提供了并行计算个阶段中数据的有效共享,弥补了MapReduce中的不足。与MapReduce单乏的Map和Reduce相比,在RDD上,Spark提供了丰富的操作,可以让程序开发人员利用RDD接口非常容易的编写出复杂的数据处理程序,先见见Sp原创 2015-05-27 16:59:06 · 456 阅读 · 0 评论 -
Spark streaming&storm流计算的相关对比
转自:http://blog.csdn.net/yangbutao/article/details/44538637 spark streaming和Storm作为当今流行的实时流计算框架,已经在实时计算方案应用的非常广泛了,其中spark streaming是基于spark的一个扩展,比storm的出现要晚一些。本章节从以下几个角度对两者进行了阐述,可以作为选型方面的一个参考。A、 数据处理方式转载 2015-07-09 15:13:37 · 504 阅读 · 0 评论