- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 spark算子分类
算子分类 Transformation算子:不触发提交作业,完成作业中间处理过程 Value数据类型的Transformation算子 输入分区与输出分区一对一型 1 map 2 flatmap 3 mapPartitions 4 glom 输入分区与输出分区多对一型 5 union 6 cartesian 输入分区与输出分区多对多型 7 groupBy 输出分区为输入分区子集型 8...
2019-10-11 11:33:53 244
原创 spark RDD算子 parallelize,makeRDD,textFile
parallelize 将一个存在的集合,变成一个RDD。这种方式试用于学习spark和做一些spark的测试 第一个参数一是一个 Seq集合 第二个参数分区数 var array = List(1, 2, 3, 4, 5, 6, 7, 8) var rdd = sc.parallelize(array,3) 1 2 makeRDD 只有scala版...
2019-10-10 15:01:05 278
dynatrace-agent-7.2.0.1697-x86(include webserver agent)--32 bit.msi
2021-05-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人