oracle下数据的排序分组row_number() over()--分析函数，可用于去重

最新推荐文章于 2022-08-05 15:03:45 发布

weixin_34221276

最新推荐文章于 2022-08-05 15:03:45 发布

阅读量303

点赞数

文章标签：数据库数据结构与算法

原文链接：http://blog.51cto.com/heshw/1275140

版权

row_number()over(partition by col1 order by col2)表示根据col1分组，在分组内部根据col2排序，而此函数计算的值就表示每组内部排序后的顺序编号（组内连续的唯一的）。
与rownum的区别在于：使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序，而此函数在包含排序从句后是先排序再计算行号码。

与此功能相似的函数还有：rank/dense_rank/ntile

row_number()和rownum差不多，功能更强一点（可以在各个分组内从1开始排序）。
rank()是跳跃排序，有两个第二名时接下来就是第四名（同样是在各个分组内）
dense_rank()也是连续排序，有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的

oracle 分析函数 row_number(),返回一个整数值(>=1)

测试表/数据

CREATE TABLE test_course (

student_name VARCHAR(10), -- 学生

course_name VARCHAR(10), -- 课程

grade INT -- 成绩

);

INSERT INTO test_course VALUES('甲', '语文', 95);

INSERT INTO test_course VALUES('乙', '语文', 85);

INSERT INTO test_course VALUES('丙', '语文', 75);

INSERT INTO test_course VALUES('丁', '语文', 65);

INSERT INTO test_course VALUES('戊', '语文', 55);

INSERT INTO test_course VALUES('己', '语文', 50);

INSERT INTO test_course VALUES('庚', '语文', 60);

INSERT INTO test_course VALUES('辛', '语文', 70);

INSERT INTO test_course VALUES('壬', '语文', 80);

INSERT INTO test_course VALUES('奎', '语文', 90);

INSERT INTO test_course VALUES('甲', '数学', 90);

INSERT INTO test_course VALUES('乙', '数学', 80);

INSERT INTO test_course VALUES('丙', '数学', 70);

INSERT INTO test_course VALUES('丁', '数学', 60);

INSERT INTO test_course VALUES('戊', '数学', 50);

INSERT INTO test_course VALUES('己', '数学', 50);

INSERT INTO test_course VALUES('庚', '数学', 60);

INSERT INTO test_course VALUES('辛', '数学', 70);

INSERT INTO test_course VALUES('壬', '数学', 85);

INSERT INTO test_course VALUES('奎', '数学', 95);

ROW_NUMBER 顺序编号

按照分数编号从高到底

SELECT

ROW_NUMBER() OVER( ORDER BY SUM(grade) DESC) AS NO,

student_name,

SUM(grade) AS AllGrade

FROM

test_course

GROUP BY

student_name

ORDER BY

SUM(grade) DESC

1 甲 185

2 奎 185

3 壬 165

4 乙 165

5 丙 145

6 辛 140

7 丁 125

8 庚 120

9 戊 105

10 己 100

按照分数编号从高到底（区分课程）

SELECT

ROW_NUMBER() OVER(PARTITION BY course_name ORDER BY grade DESC) AS NO,

FROM

test_course

ORDER BY

course_name,

grade DESC

1 奎数学 95

2 甲数学 90

3 壬数学 85

4 乙数学 80

5 丙数学 70

6 辛数学 70

7 庚数学 60

8 丁数学 60

9 戊数学 50

10 己数学 50

1 甲语文 95

2 奎语文 90

3 乙语文 85

4 壬语文 80

5 丙语文 75

6 辛语文 70

7 丁语文 65

8 庚语文 60

9 戊语文 55

10 己语文 50

RANK 排名不连续

按照分数排名从高到底

SELECT

RANK() OVER( ORDER BY SUM(grade) DESC) AS NO,

student_name,

SUM(grade) AS AllGrade

FROM

test_course

GROUP BY

student_name

ORDER BY

SUM(grade) DESC

1 甲 185

1 奎 185

3 壬 165

3 乙 165

5 丙 145

6 辛 140

7 丁 125

8 庚 120

9 戊 105

10 己 100

按照分数排名从高到底（区分课程）

SELECT

RANK() OVER(PARTITION BY course_name ORDER BY grade DESC) AS NO,

FROM

test_course

ORDER BY

course_name,

grade DESC

1 奎数学 95

2 甲数学 90

3 壬数学 85

4 乙数学 80

5 丙数学 70

5 辛数学 70

7 庚数学 60

7 丁数学 60

9 戊数学 50

9 己数学 50

1 甲语文 95

2 奎语文 90

3 乙语文 85

4 壬语文 80

5 丙语文 75

6 辛语文 70

7 丁语文 65

8 庚语文 60

9 戊语文 55

10 己语文 50

DENSE_RANK 排名连续

按照分数排名从高到底

SELECT

DENSE_RANK() OVER( ORDER BY SUM(grade) DESC) AS NO,

student_name,

SUM(grade) AS AllGrade

FROM

test_course

GROUP BY

student_name

ORDER BY

SUM(grade) DESC

1 甲 185

1 奎 185

2 壬 165

2 乙 165

3 丙 145

4 辛 140

5 丁 125

6 庚 120

7 戊 105

8 己 100

按照分数排名从高到底（区分课程）

SELECT

DENSE_RANK() OVER(PARTITION BY course_name ORDER BY grade DESC) AS NO,

FROM

test_course

ORDER BY

course_name,

grade DESC

1 奎数学 95

2 甲数学 90

3 壬数学 85

4 乙数学 80

5 丙数学 70

5 辛数学 70

6 庚数学 60

6 丁数学 60

7 戊数学 50

7 己数学 50

1 甲语文 95

2 奎语文 90

3 乙语文 85

4 壬语文 80

5 丙语文 75

6 辛语文 70

7 丁语文 65

8 庚语文 60

9 戊语文 55

10 己语文 50

NTILE 分组

按照分数划分5个区间从高到底

SELECT

NTILE(5) OVER( ORDER BY SUM(grade) DESC) AS NO,

student_name,

SUM(grade) AS AllGrade

FROM

test_course

GROUP BY

student_name

ORDER BY

SUM(grade) DESC

1 甲 185

1 奎 185

2 壬 165

2 乙 165

3 丙 145

3 辛 140

4 丁 125

4 庚 120

5 戊 105

5 己 100

按照分数划分区间从高到底（区分课程）

SELECT

NTILE(5) OVER(PARTITION BY course_name ORDER BY grade DESC) AS NO,

FROM

test_course

ORDER BY

course_name,

grade DESC

1 奎数学 95

1 甲数学 90

2 壬数学 85

2 乙数学 80

3 丙数学 70

3 辛数学 70

4 庚数学 60

4 丁数学 60

5 戊数学 50

5 己数学 50

1 甲语文 95

1 奎语文 90

2 乙语文 85

2 壬语文 80

3 丙语文 75

3 辛语文 70

4 丁语文 65

4 庚语文 60

5 戊语文 55

5 己语文 50

使用分析函数来进行去重的例子：

product	loid	time
aaa	AAABBBCCC	2013-4-5
aaa	CCC55SSADD	2013-4-13
bbb	FFFF223SSSA	2013-8-8
bbb	GSAAASSFBB	2013-8-1

数据结构如上图，其中第1列有重复，第2列唯一，第3列为时间，有大小唯一。需求:一个product只能有一个loid，现需要根据时间大小，保留最后一次增加的数据，将时间小的product删除。最后得到结果如下：

product	loid	time
aaa	CCC55SSADD	2013-4-13
bbb	FFFF223SSSA	2013-8-8

思路：根据product来进行分组编号，通过时间大小来排序。筛选出时间最大的loid，再根据loid将product重复的删除)

select row_number() over(partition by product order by time desc) as no,product,loid,time from test; --通过分析函数进行分组编号

select loid from (select row_number() over(partition by product order by time desc) as no,product,loid,time from test) where no=1; ---得出满足条件的loid，因为为降序，所以不管product重复的有几个，编号为1的始终为分组内时间最大的

delete from test where loid not in (select loid from (select row_number() over(partition by product order by time desc) as no,product,loid,time from test) where no=1); --根据得出的满足条件的loid来进行筛选删除。

此为通过分析函数来去重的例子，其他重复数据的查找与删除，可通过rowid或分组来进行。

转载于:https://blog.51cto.com/heshw/1275140

weixin_34221276

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
oracle下数据的排序分组row_number() over()--分析函数，可用于去重

row_number()over(partition by col1 order by col2)表示根据col1分组，在分组内部根据col2排序，而此函数计算的值就表示每组内部排序后的顺序编号（组内连续的唯一的）。与rownum的区别在于：使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序，而此函数在包含排序从句后是先排序再计算行号码。 ...
复制链接

扫一扫