1、Spark之内存计算框架--课程内容介绍
知识点:spark的课前准备内容
2、通过IDEA工具开发Spark的入门案例
知识点:maven构建scala工程
3、Spark之内存计算框架--通过IDEA工具开发Spark的入门案例--代码开发
知识点:scala语法、spark程序开发
4、Spark之内存计算框架--程序打成jar包提交到Spark集群中运行
知识点:程序打成jar包、spark-submit提交任务命令的使用
5、Spark之内存计算框架--Spark底层编程抽象之RDD是什么
知识点:Spark底层核心RDD
6、Spark之内存计算框架--Spark底层编程抽象之RDD的五大特性
知识点:Spark底层核心RDD的特性
7、基于单词统计案例来深度剖析RDD的五大特性
知识点:Spark底层核心RDD的五大特性深度剖析
8、Spark底层核心RDD的算子操作分类
知识点:spark底层核心RDD的算子分类
9、Spark底层核心RDD的依赖关系
知识点:spark底层核心RDD的依赖关系(宽窄依赖)
10、Spark底层核心RDD的缓存机制
知识点:spark底层核心RDD的缓存机制、应用场景、如何使用、如何清除缓存
11、DAG有向无环图的构建和划分stage
知识点:DAG有向无环图和划分stage
12、基于wordcount程序剖析Spark任务的提交、划分、调度流程
知识点:spark任务提交、划分、调度流程剖析
13、通过Spark开发实现点击流日志分析案例
知识点:RDD常见的算子count/map/distinct/filter/sortByKey使用
14、通过Spark开发实现ip归属地查询案例--需求介绍
知识点:ip归属地查询需求介绍说明
15、通过Spark开发实现ip归属地查询案例--代码开发