'requirement failed: Cannot have an empty string for name. '

今天测试pyspark重的encode出现了

pyspark.sql.utils.IllegalArgumentException: 'requirement failed: Cannot have an empty string for name. '

这个问题的主要原因是OneHotEncoder不能处理空字符串。所以我们需要将数据集中的空字符串提前处理一下。
一般可以使用 dropna 或者 na.fill/na.replace 来处理。

例如:

df = df.na.replace('','NA')
©️2020 CSDN 皮肤主题: 技术黑板 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值