环境搭建
- CDH搭建
- HDFS实现扩容
- 大数据分析集群环境(hadoop,spark,yarn)
- Hadoop集群安装
- Spark集群安装
Google的三驾马车
- FileSystem
- Big Table
- MapReduce
Scala
- 使用Scala语言开发spark应用
- Spark指南和编程风格
Spark
- spark部分知识:
- SparkContext
- job
- shuffle
- stage
- task
- rdd
- dataframe
- mllib guide
- spark-streaming