Spark RDD算子整理 -- 转换算子 行动算子
转换算子操作:filter过滤符合条件的记录数,true保留,false过滤掉。map将一个RDD中的每个数据项,通过map中的函数映射变为一个新的元素。特点:输入一条,输出一条数据。flatMap先map后flat。与map类似,每个输入项可以映射为0到多个输出项。sample随机抽样算子,根据传进去的小数按比例进行有放回或者无放回的抽样。reduceByKey...
原创
2019-04-17 10:29:14 ·
1747 阅读 ·
3 评论