首先union去重,union all 不去重,union能对多行相同的数据只留一行。但是有些实际应用中union无法去重,却又找不到原因,往往是因为查询语句与建表语句的数据格式不同,比如建表时,money 字段为bigint类型,然后查询语句中sum(xxx) money,得到的是Int类型,如果两个重复数据进行union时,即使两个数据都是Int类型,也不会进行去重,需要都与建表语句的类型一致才能去重。
hive中union的一些问题
最新推荐文章于 2024-05-14 08:49:39 发布