Hadoop生态,包括HDFS、MapReduce、YARN、HBase等等。
CentOS 7 单机安装最新版Hadoop v3.1.2以及配置和简单测试
Hadoop v3.1.2 伪分布式安装(Pseudo-Distributed Operation)
Hadoop生态系统-新手快速入门(含HDFS、HBase系统架构)
HBase v2.1.4 最新版安装-单机模式(CentOS 7)
YARN-Hadoop资源管理调度框架-深入理解系统架构和工作流程
Storm流计算框架
流计算框架-最新版Apache Storm v2.0单机模式安装详细步骤
Apache Storm v2.0入门项目的开发、测试和运行(IDEA/Maven)
Spark & Spark Streaming 计算框架
Spark 框架核心组件,以及Spark和Hadoop生态关系
Spark大数据处理框架入门-包括生态系统、运行流程以及部署方式
最新版Spark v2.4.3详细安装过程以及Spark Shell命令行操作演示
Spark v2.4.3应用程序开发入门-基于IDEA/Maven 构建简单应用
Spark Streaming基本原理、执行流程以及单词统计简单应用开发
Flink 流批计算框架
Apache Flink快速入门-基本架构、核心概念和运行流程
Apache Flink v1.9-SNAPSHOT 源码编译
Apache Flink v1.8 本地单机环境安装和运行Flink应用
Apache Flink-基于Java项目模板创建Flink应用(流计算和批计算)
其他大数据相关话题
聊聊Hadoop、Storm、Spark Streaming、Flink在大数据领域的现状
聊聊批计算、流计算、Hadoop、Spark、Storm、Flink等等
Apache Beam:开源的统一编程模型,实现批、流数据处理作业