前文:
RDD算子
一、基本操作(懒算子)
启动:sh spark-shell --master=local
1、不同输入集合
2、创建、分区
3、读取文件
4、取值排序
5、Transformation(核心)
6、分组计算(核心)
7、交并集操作
8、乘积
二、Actions(执行)
1、List(Int)
2、(String,Int)
三、案例
1、倒排索引
前文:
RDD算子
一、基本操作(懒算子)
启动:sh spark-shell --master=local
1、不同输入集合
2、创建、分区
3、读取文件
4、取值排序
5、Transformation(核心)
6、分组计算(核心)
7、交并集操作
8、乘积
二、Actions(执行)
1、List(Int)
2、(String,Int)
三、案例
1、倒排索引