在准备开始撸大数据的理论知识之前,我需要构建一个大概的轮廓 技术框架 大数据相关的框架或者说生态有Hadoop、Spark、Storm、Flink等等。 在开始之前我先整理了这些名词的含义和区别。 Apache Hadoop 批处理框架Storm 流处理框架Spark、Flink 混合框架 记录一些文章 Spark详解 待续…