目录
1.RDD的处理过程
2.行动算子
常见行动算子
2.1 count() 返回元素个数
创建一个数组
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.count()
得到对应的结果
2.2 first() 返回第一个元素
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.first()
得到对应的结果
2.3 take(n) 返回前n个元素
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.take(n)
n为有理整数,得到对应的结果
2.4 reduce(func) 返回所有元素的累加值
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.reduce((a,b)=>a+b)
累加聚合,得到结果
2.5 collect() 返回所有元素
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.collect()
2.6 foreach(func)
例子:遍历数组
输入:val arrRdd=sc.parallelize(Array(1,2,3,4,5))
输入:arrRdd.foreach(x=>println(x))
3. 总览