现在有一张如下图所示的表,想对重复的orderid 进行去重,看同事的代码时看到了rownumber() over(partition by col1 order by col2)去重的方法很好,分享给大家。
1.查询所有,如果orderid 相同,则按照price 排序
select orderid,foodName,price ,ROW_NUMBER() OVER(PARTITION BY orderid order by price desc) from Table_3;
得到的结果如下:数据表先按照orderid 分组,在分组内按照price降序排序。
row_number()函数在分组内部排序后的顺序编号(组内连续唯一的)。
2.如果想得到不重复的orderid,让每一个orderid 只得到一条数据,则可使用下面的语句:
SELECT s.* FROM (SELECT orderid,foodName,price ,ROW_NUMBER() OVER( PARTITION BY orderid ORDER BY price DESC)as rowid FROM Table_3 )s WHERE s.rowid= 1;
由查询结果可知,相同orderid 的只保留了rowid=1 的记录,其他的都被过滤掉了,从而达到了对orderid 去重处理。
3.跳跃排序
Rank() over(partition by col1 order by col2)
select *, rank() over(partition by orderid order by price desc) from Table_3;
由查询结果可知,相同的并列,下一个则跳跃到并列所替的序列后:如有两个并列1,那么下一个则直接排为3,跳过2;
4.连续排序
DENSE_RANK() OVER(PARTITION BY COL1 ORDER BY COL2)
select *, dense_rank() over(partition by orderid order by price desc) from Table_3;
由查询结果可知,当两个并列为1时,下一个仍连续有序为2,不跳跃到3
5.sum() over (partition by col1 order by col2)
参考:http://blog.csdn.net/zengmingen/article/details/50786229。