- 博客(3)
- 收藏
- 关注
原创 RDD编程(python版)总结
一、RDD创建方式包括:parallelize、textFile1.parallelize:将一个已存在的集合生成RDD。2.textFile:通过读取外部文件生成RDD二、将RDD显示的方法包括:foreach()、collect()三、RDD的操作:包括两类,转换操作和行动操作。1.转换操作中的常用操作有:filter()、map()、flatMap()、groupBy()、reduceByKey()。(1)filter(func):用于筛选。例1:将data中含有hadoop的元素筛选出
2021-06-25 00:40:51
1770
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人