HIVE中SQL根据某列去重
如一个表trans_table有三个列,trans_date,user_id,trans_money,每个user可能有多个交易记录,想只取一条,可以用如下命令:
select * from
(select *, row_number() over(partition by user_id order by trans_money desc) num from trans_table)
where num=1
得出的结果会多出一列,即num列,该列的值均为1