spark 不常见的问题_000301Hive常见问题汇总

本文总结了Hive在与Spark交互时遇到的一些不常见问题,包括Hive查询异常、数据读取问题、UDF管理以及时间转换等,并提供了相应的解决方案。如Hive在Tez引擎下避免创建子目录导致的数据丢失,Hive无法读取Spark保存的Parquet文件,以及Hive分区表新增字段后元数据不更新等。同时,还提及了Zookeeper和服务端启动的相关知识点。
摘要由CSDN通过智能技术生成
每日一句所以,要好好努力然后多挣钱,才养得起自己这个爱吃的胃,爱玩儿的心,爱逛爱买的习惯。一个人往,一个人来,也能生活得很好。by 德卡先生
version Desc
2020-09-07 Hive日常使用遇到的问题
0 1

修改Hive存储格式

alter table ods.t_device set FILEFORMAT parquet;
02

hive select count(1) 查询有数据,select * from 无数据

  •   原因一:表定义的location和hdfs存储路径不一致;另hive on tez 会出现路径不一致问题,改用hive on mr 或hive on spark即可解决,该问题为hive bug

  • 原因二:表结构未压缩,数据是压缩格式

set mapred.output.compress=true;set hive.exec.compress.output=true;set mapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec;
03

hive on tez  avoid creating subdirectories

  • 现象:tez 引擎下执行insert union 操作,然后在mr引擎下执行sel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值