Hive和Imapla查询decimal类型结果不同异常

本文详述了一起在Hive和Impala中查询数据时遇到的精度不匹配问题。当decimal类型字段的精度超过设定值时,Hive会丢失精度显示结果,而Impala则直接返回空。解决办法是通过ALTER TABLE语句更改字段类型为string,从而避免精度丢失并确保查询一致性。在建表时应注意数据精度与字段类型匹配,避免类似问题发生。
摘要由CSDN通过智能技术生成

异常重现

1.当前集群HDFS上/tmp/newfile目录下存在文件hive.txt

[root@cdp4 ~]# mkdir /data/ZK
[root@cdp4 ~]# 

 

2.从Hue中创建一个hive表test如下

create external table test (s1 string,s2 decimal(13,2)) row format delimited fields terminated by '#' stored as textfile location '/tmp/newfile'    

3.在Hive中进行查询,可以看到结果如下图。

select * from test

4.在Impala中进行查询,可以看到s2列全部为空

同样的表,在Hive和Impala中分别进行查询,结果不同,异常得以重现。

异常分析

根据异常重现部分的步骤,S2字段的数据类型是decimal(13,2)。精度只有2位,但是我们原始数据小数点后都是有3位小数。Hive在这里进行查询的时候会损失精度,打印结果。但是Impala在查询的时候,校验decimal类型会更严格,当前的原始数据精度超过了S2字段设定的数据类型的精度,所以直接返回为空。

异常解决

根据上面的分析,是由于数据的精度超过了S2字段的设定,这里可以通过改变字段类型来进行解决。

1.在Hue中执行下面的SQL进行字段类型的变更

ALTER TABLE test CHANGE s2 s2 string

2.再次进行查询,可以看到Impala中可以查到数据了,并且可以看到S2字段的数据类型已经变成了string

3.由于数据类型变了,我们再从hive中查询,可以看到,查询结果也变化了,跟Impala中的查询结果一致。

总结

1.在Hive和Impala同时间遇到精度不匹配的情况的时候,Hive会通过损失精度来输出结果,同样的情况,Impala则会直接返回NULL。

2.在建表的时候,如果涉及到decimal数据类型,我们需要根据原始数据的精度,来设计好相关的参数,避免出现精度丢失的情况。

3.如果由于历史原因,当前的表中已经出现精度丢失,我们可以通过转换数据类型,来进行处理。可以先转换成string类型,进行查询。后面也可以根据表的数据范围,再修改成其他精度匹配的数据类型,进行处理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
回答: 当在Hive查询decimal类型字段时报错,可能是由于以下原因导致的。首先,Hive中的decimal字段默认精度为0,如果不指定小数点,数据将被四舍五入。例如,0.82在Hive中会变成1。因此,在建表时最好指定精度,如decimal(10,2)。\[1\]其次,当使用Sqoop导出数据时,需要注意设置--input-null-string '\\N'和--input-null-non-string '\\N'这两个参数。因为Hive中的null默认是\N,而Sqoop在导出数据时会解析\N。如果目标关系型数据库中的表字段不是string类型,就会报错。通过设置这两个参数,Sqoop会知道\N表示null,而不会将其解析为字符。\[2\]最后,如果在修改了字段类型后,表的schema发生了变化,而之前的分区仍然使用旧的schema,就会导致表和分区的schema不一致,从而导致select报错。在这种情况下,需要更新分区的schema以与表的schema保持一致。\[3\] #### 引用[.reference_title] - *1* *2* [Hadoop记录——hive中的decimal字段,shell的数据类型以及sqoop导出空string报错](https://blog.csdn.net/chenKFKevin/article/details/53199925)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [hive字段类型修改问题总结](https://blog.csdn.net/qq_36302506/article/details/117091191)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AllenGd

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值