spark和Hive统计结构不一样的问题解决

最新推荐文章于 2022-10-31 21:45:35 发布

黑肚皮的窝

最新推荐文章于 2022-10-31 21:45:35 发布

阅读量656

点赞数

分类专栏：大数据行舟文章标签： hive spark big data

本文链接：https://blog.csdn.net/joomlaer/article/details/120901304

版权

4 篇文章 0 订阅

订阅专栏

问题：

select * from dws.dws_example where dt = '2021-10-19' limit 10;

用Hive可以读取。

但是用spark-sql读取没有结果。

并且读取另外的分区，

select * from dws.dws_example where dt = '2021-10-19' limit 10;

都能读取到记录。

解决思路：

到hive里show create table

得到结果:

|   'orc.compress'='SNAPPY',

怀疑这个问题是spark和hive元数据冲突。

查看spark文档，得到解决方案。

spark-sql --conf spark.hadoop.metastore.catalog.default=hive --conf spark.sql.hive.convertMetastoreOrc=false

问题搞定。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注