- flatMap 算子:
- 格式: flatMap(fn)
- 说明: 在map算子的基础上, 在加入一个压扁的操作, 主要适用于一行中包含多个内容的操作, 实现一转多的操作
rdd = sc.parallelize(['张三|李四|王五|赵六','田七|周八|李九'])
需求: 将数据转换为一个个的姓名
rdd.flatMap(lambda line: line.split('|')).collect()
结果:
['张三', '李四', '王五', '赵六', '田七', '周八', '李九']