CDA大数据分析师学习记录(持续更新)
目录(本文为大纲与参考书)
PART1 大数据基础理论 8%
1.大数据分析基础 1%
2. Python 基础 5%
3. Linux & Ubuntu 操作系统基础 2%
PART 2 Hadoop 理论 12%
- Hadoop 安装配置及运行机制解析 2%
- HDFS 分布式文件系统 2%
- MapReduce 理论及实战 2%
- Hadoop 生态其他常用组件 6%
PART 3 大数据分析之数据库理论及工具 16%
- 数据库导论 2%
- MySQL 理论及实战 3%
- HBase 安装及使用 3%
- Hive 安装及使用 5%
- Sqoop 安装及使用 3%
PART 4 大数据分析之数据挖掘理论基础 占比10%
- 数据挖掘的基本思想 2%
- 数据挖掘基本方法介绍 2%
- 有监督学习算法 4%
- 无监督学习算法 2%
PART 5 大数据分析之 Spark 工具及实战 占比35%
- Spark 基础理论 2%
- b. Spark RDD 基本概念及常用操作 3%
- c. Spark 流式计算框架 Spark Streaming、Structured Streaming 5%
- d. Spark 交互式数据查询框架 Spark SQL 5%
- e. Spark 机器学习算法库 Spark MLl