hive表关联结果异常问题

sql:

select 
a.order_code,b.order_id
from 
(select 
order_code
from ods.ods_lsh_oms_order_head 
where dt = '2018-08-05'
group by order_code) a
join 
(select 
order_id
from default.mds_lsh_trade_order_goods
where dt = '2018-08-05'
group by order_id) b
on a.order_code = b.order_id
where a.order_code = '6431878663716741120'

结果

这里写图片描述
可以看出结果异常,6431878663716741121这条数据也被关联出来。

结果分析

  • 这两个表的关联键的数据类型不一致,order_code(bigint)、order_id(string);
  • Hive不同类型数字关联的时候,会统一转化为double类型;
  • order_id是19位整数,而double最多可以精确的表示14-15位整数,超出位数后就会出现不准确的情况,也就是说6431878663716741120,6431878663716741121两个订单号转成double类型后,会被认为是相等的;

解决办法

将两个表关联键的数据类型转成一致即可
cast(order_id as bigint)

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值