1)map
map是对RDD中的每个元素都执行一个指定的函数来产生一个新的RDD,RDD之间的元素是一对一关系
val rdd1=sc.parallelize(1 to 9,3)
val rdd2=rdd1.map(x=>x*2)
rdd2中则存放(2, 4, 6, 8, 10, 12, 14, 16, 18)
2)filter
Filter是对RDD元素进行过滤,返回一个新的数据集
val rdd1=sc.parallelize(1 to 9,3)
val rdd2=rdd1.filter(x=>x>5)
rdd2中则存放(6,7,8,9&#