记一次对多字段按照优先级分类再进行排序

最新推荐文章于 2021-12-06 15:24:38 发布

doraHP

最新推荐文章于 2021-12-06 15:24:38 发布

阅读量1.4k

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/qq_36557960/article/details/107592854

版权

算法专栏收录该内容

14 篇文章 0 订阅

订阅专栏

在数据查询中，有时候会遇到使用两个或两个以上字段对一组数据集合进行排序，较为合理的处理逻辑应该是先按照字段之间的优先级关系将待排序的数据集合递归地以同一字段的值（同一层）升序或降序的方式进行拆分，然后在以由上往下顺（广度优先方式）序对父节点的叶子节点按照指定规则进行排序。(注：如果底层支持传入compare方法，那么每一组字段排序组合设计一种compare算法，会更加高效）

SQL语句中可以使用order by语句对多个字段进行排序（暂不清楚其实现原理，有可能和上面提到的处理逻辑类似）。该篇文章会讨论一种新的处理手段，将所有参加排序的字段按照指定的优先级关系从低到高以字节填充（binary）的方式将内容追加到一个字节切片（支持扩容的数组）中（区分大小写），即将多字段的排序”归化为“单一字段的排序。

举例：s公司最近要统计不同年龄段中，不同薪资的员工信息，为了让数据更直观，上层要求按照员工年龄（出生日期）降序、员工月薪降序和员工姓名升序的规则进行排序统计。若以“归一化”方法进行排序，原理如下图。

由于出生日期可以以“19980408”的整型表示，月薪则已元作为计数单位（忽略小数部分），姓名以字符字节表示。无论是怎样的数据类型，都会以字节填充到“新字段”中，不过由于出生日期和月薪是以降序排序，我们需要对其值进行处理，新的出生日期=0xffffffff-老的出生日期，新的月薪=0xffff-老的月薪。其中“归一化”排序的核心过程为“填充字节序列+比较”。

所以该排序算法支持多字段且多类型的排序，无需为每一种排序组合都写一个排序算法，只需以字节（如上面的员工年龄和员工月薪可能需要对数据进行特殊处理）作为参数传入并获取一个“新字段”的字节序列，再以”新字段“构成的集合作为参数传入并获取到一个已经排好序的集合。