分组排序函数的用法

项目开发中,我们有时会碰到需要分组排序来解决问题的情况,如:1、要求取出按field1分组后,并在每组中按照field2排序;2、亦或更加要求取出1中已经分组排序好的前多少行的数据

这里通过一张表的示例和SQL语句阐述下oracle数据库中用于分组排序函数的用法。

a、row_number() over()

row_number()over(partition by col1 order by col2)表示根据col1分组,在分组内部根据col2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)。 
与rownum的区别在于:使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序,而此函数在包含排序从句后是先排序再计算行号码。row_number()和rownum差不多,功能更强一点(可以在各个分组内从1开始排序)。 
b、rank() over()

rank()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内)

c、dense_rank() over()

dense_rank()也是连续排序,有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的。

 

示例:

如有表Test,数据如下

 

  1. CREATEDATE      ACCNO   MONEY  
  2. 2014/6/5           111      200   
  3. 2014/6/4           111      600   
  4. 2014/6/5           111      400   
  5. 2014/6/6           111      300   
  6. 2014/6/6           222      200   
  7. 2014/6/5           222      800   
  8. 2014/6/6           222      500   
  9. 2014/6/7           222      100   
  10. 2014/6/6           333      800   
  11. 2014/6/7           333      500   
  12. 2014/6/8           333      200   
  13. 2014/6/9           333      0  

  

比如要根据ACCNO分组,并且每组按照CREATEDATE排序,是组内排序,并不是所有的数据统一排序,

用下列语句实现:

 

 

  1. select t.*,row_number() over(partition by accno order by createDate) row_number from Test t  

 

查询结果如下:

 

 

 

大家可以注意到ACCNO为111的记录有两个相同的CREATEDATE,用row_number函数,他们的组内计数是连续唯一的,但是如果用rank或者dense_rank函数,效果就不一样,如下:

rank的sql:

  1. select t.*,rank() over(partition by accno order by createDate) rank from Test t  

 

查询结果:



 

可以发现相同CREATEDATE的两条记录是两个第2时接下来就是第4.

 

dense_rank的sql:

  1. select t.*,dense_rank() over(partition by accno order by createDate) dense_rank from Test t  

 

查询结果:



 

可以发现相同CREATEDATE的两个字段是两个第2时接下来就是第3.

 

项目中特殊的业务需求可能会要求用以上三个不同的函数,具体情况具体对待。

 

 

再比如有时会要求分组排序后分别取出各组内前多少的数据记录,sql如下:

  1. select createDate,accno,money,row_number from  (select t.*,row_number() over(partition by accno order by createDate) row_number from Test t) t1 where row_number<4  

  

 

查询结果如下:


工欲善其事,必先利其器。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Python中,进行数据分组排序是非常常见的操作。要实现分组排序,可以使用多种工具。其中,pandas是进行数据分析的首选工具,它提供了强大的分组排序功能。使用pandas,你可以使用groupby方法对数据进行分组,并使用sort_values方法对每个组的数据进行排序。例如,你可以按照某一列的值进行分组,然后按照另一列的值进行排序。 另外,numpy也在处理数值计算方面表现出色,可以用来进行分组排序。numpy提供了例如argsort等函数,可以根据指定的条件对数组进行排序。 此外,Python的标准库也提供了简单而强大的分组排序工具。例如,你可以使用itertools.groupby函数对数据进行分组,然后使用sorted函数对每个组的数据进行排序。具体的实现方式可以参考引用中的示例代码。 总之,在Python中进行分组排序有多种选择,可以根据实际需求和数据类型选择合适的工具进行操作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [chatgpt赋能python:Python分组排序完全指南](https://blog.csdn.net/lvsetongdao123/article/details/131098789)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值