# flatMapValues
x = sc.parallelize([('A',(1,2,3)),('B',(4,5))])
y = x.flatMapValues(lambda x: [i**2 for i in x]) # function is applied to entire value, then result is flattened
print(x.collect())
print(y.collect())
[('A', (1, 2, 3)), ('B', (4, 5))]
[('A', 1), ('A', 4), ('A', 9), ('B', 16), ('B', 25)]
pyspark中flatMapValues的用法
本文介绍了如何在PySpark中使用flatMapValues函数对数据进行扁平化处理,通过sc.parallelize创建的分布式数据集实例展示了该操作。通过函数应用到每个值并合并结果,实现了('A', (1, 4, 9)) 和 ('B', (16, 25)) 的输出。
摘要由CSDN通过智能技术生成