python when函数_python-将列传递给pyspark中的when函数

最新推荐文章于 2021-07-10 00:30:59 发布

weixin_39821718

最新推荐文章于 2021-07-10 00:30:59 发布

阅读量734

点赞数

文章标签： python when函数

这个问题已经有了答案：

我有两个pyspark DataFrame ：

第一 DataFrame ：工厂

+-----+--------+

|plant|station |

+-----+--------+

|Kech | st1 |

|Casa | st2 |

+-----+--------+

第二 DataFrame ：站点

+-------+--------+

|program|station |

+-------+--------+

|pr1 | null|

|pr2 | st1 |

+-------+--------+

我想要的是将第二个 DataFrame 站中的空值替换为第一个 DataFrame 中的所有列站。这样地：

+-------+--------------+

|program|station |

+-------+--------------+

|pr1 | [st1, st2]|

|pr2 | st1 |

+-------+--------------+

我做到了：

stList = plants.select(F.col('station')).rdd.map(lambda x: x[0]).collect()

stations = stations.select(

F.col('program')

F.when(stations.station.isNull(), stList).otherwise(stations.station).alias('station')

)

但是当不接受python list作为参数时，它会给我一个错误

weixin_39821718

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python when函数_python-将列传递给pyspark中的when函数

这个问题已经有了答案：我有两个pyspark DataFrame ：第一 DataFrame ：工厂+-----+--------+|plant|station |+-----+--------+|Kech | st1 ||Casa | st2 |+-----+--------+第二 DataFrame ：站点+-------+--------+|program|station |+-...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。