最近正好把几片big data application方面的文章读完,做了点笔记,还是放在GitBook中。
Storm twitter的流处理
https://lschacker.gitbooks.io/bigdata-intro/content/storm.html
StreamScope / rStream 微软的流处理
https://lschacker.gitbooks.io/bigdata-intro/content/rstream.html
Pregel 图处理
https://lschacker.gitbooks.io/bigdata-intro/content/pregel.html
GraphX 图处理
(一般是利用GraphX上面实现Pregel的接口)
https://lschacker.gitbooks.io/bigdata-intro/content/graphx.html
BlinkDB
FB的presto就是这种类似的优化
https://lschacker.gitbooks.io/bigdata-intro/content/blinkdb-queries-with-bounded-errors-and-bounded-response-times-on-very-large-data.html
最后附一张图,简单的列一下每一个框架的特点