- 博客(1)
- 收藏
- 关注
原创 spark
在进行处理时,reduceByKey()方法将相同键的前两个值传给输入函数,产生一个新的返回值,新产生的返回值与RDD中相同键的下一个值组成两个元素,再传给输入函数,直到最后每个键只有一个对应的值为止。使用flatMap()方法时先进行map(映射)再进行flat(扁平化)操作,数据会先经过跟map一样的操作,为每一条输入返回一个迭代器(可迭代的数据类型),然后将所得到的不同级别的迭代器中的元素全部当成同级别的元素,返回一个元素级别全部相同的RDD。两个RDD的顺序会影响结果。
2024-05-13 16:43:24 1050 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人