- map算子:
- 格式: rdd.map(fn)
- 说明: 根据传入的函数, 对数据进行一对一的转换操作, 传入一行, 返回一行
rdd = sc.parallelize([1,2,3,4,5,6,7,8,9,10])
需求: 请对每一个元素进行 +1 返回
def fn1(e):
return e + 1
rdd.map(fn1).collect()
结果为:
[2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
当一个函数中只有一行代码的时候, 可以将其改写为lambda的匿名函数
rdd.map(lambda e: e + 1).collect()
结果为:
[2, 3, 4, 5, 6, 7, 8, 9, 10, 11]