pyspark.sql.utils.AnalysisException: Parquet data source does not support null data type

SLUMBER_PARTY_

于 2024-05-21 10:45:52 发布

阅读量274

点赞数 8

文章标签： pyspark 大数据 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nanfeizhenkuangou/article/details/139086586

版权

pyspark.sql.utils.AnalysisException: Parquet data source does not support null data type。

这个错误见过很多次了，每次都没有追根究底，也忘了每次怎么调的bug就好了。

我打印了下df.printSchema()，发现有字段的字段类型就是null。我一直以为是其他类型，只不过这个字段的值全是null。起因是我有几个字段是这样定义的，df.selectExpr(”null as A”,”null as B”)，当然不知道A和B原本应该是什么类型了。

我使用df.fillna(value=‘’,subsets=[“A”,”B”])没用，我打印出来的A字段类型类型还是null，所以只能强制转换类型了。没用的原因应该是没有转换类型，你就填充一个别的类型，spark不答应吧。

df.withColumn("A",F.expr("string(A)")).withColumn("A",F.expr("string(A)"))

就这样，转换一下类型，别是null类型就可以了

关注

8
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pyspark.sql.utils.AnalysisException: Parquet data source does not support null data type

起因是我有几个字段是这样定义的，df.selectExpr(”null as A”,”null as B”)，当然不知道A和B原本应该是什么类型了。我使用df.fillna(value=‘’,subsets=[“A”,”B”])没用，我打印出来的A字段类型类型还是null，所以只能强制转换类型了。没用的原因应该是没有转换类型，你就填充一个别的类型，spark不答应吧。这个错误见过很多次了，每次都没有追根究底，也忘了每次怎么调的bug就好了。就这样，转换一下类型，别是null类型就可以了。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。