【转】oracle over函数详解

转载:http://wenku.baidu.com/view/afcc6984d4d8d15abe234ed7.html

今天在javaeye上看到一道面试题,很多人都用over函数解决的 
特意查了一下它的用法
SQL> select deptno,ename,sal
   2   from emp
   3   order by deptno;

DEPTNO ENAME          SAL
---------- ---------- ----------
       10 CLARK         2450
          KING         5000
          MILLER          1300

       20 SMITH         800
          ADAMS         1100
          FORD         3000
          SCOTT         3000
          JONES         2975

       30 ALLEN         1600
          BLAKE         2850
          MARTIN          1250
          JAMES         950
          TURNER          1500
          WARD         1250


已选择14行。



2.
先来一个简单的,注意over(...)条件的不同,
使用 sum(sal) over(order by ename)... 查询员工的薪水连续求和,
注意over(order   by ename)如果没有order by 子句,求和就不是连续的,
放在一起,体会一下不同之处:

SQL> select deptno,ename,sal,
   2   sum(sal) over (order by ename) 
连续求和,
   3   sum(sal) over () 
总和,               -- 此处sum(sal) over () 等同于sum(sal)
   4   100*round(sal/sum(sal) over (),4) "
份额(%)"
   5   from emp
   6   /

DEPTNO ENAME          SAL 
连续求和    总和份额(%)
---------- ---------- ---------- ---------- ---------- ----------
       20 ADAMS         1100    1100    29025    3.79
       30 ALLEN         1600    2700    29025    5.51
       30 BLAKE         2850    5550    29025    9.82
       10 CLARK         2450    8000    29025    8.44
       20 FORD         3000    11000    29025    10.34
       30 JAMES         950    11950    29025    3.27
       20 JONES         2975    14925    29025    10.25
       10 KING         5000    19925    29025    17.23
       30 MARTIN          1250    21175    29025    4.31
       10 MILLER          1300    22475    29025    4.48
       20 SCOTT         3000    25475    29025    10.34
       20 SMITH         800    26275    29025    2.76
       30 TURNER          1500    27775    29025    5.17
       30 WARD         1250    29025    29025    4.31

已选择14行。


3.
使用子分区查出各部门薪水连续的总和。注意按部门分区。注意over(...)条件的不同,
sum(sal) over (partition by deptno order by ename) 
按部门连续求总和
sum(sal) over (partition by deptno) 
按部门求总和
sum(sal) over (order by deptno
ename) 不按部门连续求总和
sum(sal) over () 
不按部门,求所有员工总和,效果等同于sum(sal)

SQL> select deptno,ename,sal,
   2   sum(sal) over (partition by deptno order by ename) 
部门连续求和,--各部门的薪水"连续"求和
   3   sum(sal) over (partition by deptno) 
部门总和,   -- 部门统计的总和,同一部门总和不变
   4   100*round(sal/sum(sal) over (partition by deptno),4)"
部门份额(%)",
   5   sum(sal) over (order by deptno,ename) 
连续求和, --所有部门的薪水"连续"求和
   6   sum(sal) over () 
总和,   -- 此处sum(sal) over () 等同于sum(sal),所有员工的薪水总和
   7   100*round(sal/sum(sal) over (),4) "
总份额(%)"
   8   from emp
   9   /

DEPTNO ENAME SAL 
部门连续求和部门总和部门份额(%) 连续求和总和   总份额(%)
------ ------ ----- ------------ ---------- ----------- ---------- ----------------
10 CLARK 2450       2450    8750      28    2450   29025    8.44
   KING 5000       7450    8750   57.14    7450   29025    17.23
   MILLER   1300       8750   8750    14.86    8750   29025   4.48

20 ADAMS 1100       1100    10875   10.11    9850   29025    3.79
   FORD 3000       4100    10875   27.59    12850   29025    10.34
   JONES 2975       7075    10875   27.36    15825   29025    10.25
   SCOTT 3000        10075   10875    27.59    18825   29025   10.34
   SMITH 800        10875    10875       7.36    19625   29025   2.76

30 ALLEN 1600       1600    9400   17.02    21225   29025    5.51
   BLAKE 2850       4450    9400   30.32    24075   29025    9.82
   JAMES 950       5400    9400   10.11    25025   29025    3.27
   MARTIN   1250       6650   9400        13.3   26275   29025    4.31
   TURNER   1500       8150   9400    15.96    27775   29025   5.17
   WARD 1250       9400    9400       13.3    29025   29025   4.31


已选择14行。



4.
来一个综合的例子,求和规则有按部门分区的,有不分区的例子
SQL> select deptno,ename,sal,sum(sal) over (partition by deptno order bysal) dept_sum,
   2   sum(sal) over (order by deptno,sal) sum
   3   from emp;

DEPTNO ENAME          SAL DEPT_SUM       SUM
---------- ---------- ---------- ---------- ----------
       10 MILLER          1300    1300    1300
          CLARK         2450    3750    3750
          KING         5000    8750    8750

       20 SMITH         800        800    9550
          ADAMS         1100    1900    10650
          JONES         2975    4875    13625
          SCOTT         3000    10875    19625
          FORD         3000    10875    19625

       30 JAMES         950        950    20575
          WARD         1250    3450    23075
          MARTIN          1250    3450    23075
          TURNER          1500    4950    24575
          ALLEN         1600    6550    26175
          BLAKE         2850    9400    29025


已选择14行。



5.
来一个逆序的,即部门从大到小排列,部门里各员工的薪水从高到低排列,累计和的规则不变。

SQL> select deptno,ename,sal,
   2   sum(sal) over (partition by deptno order by deptnodesc,sal desc) dept_sum,
   3   sum(sal) over (order by deptno desc,sal desc) sum
   4   from emp;

DEPTNO ENAME          SAL DEPT_SUM       SUM
---------- ---------- ---------- ---------- ----------
       30 BLAKE         2850    2850    2850
          ALLEN         1600    4450    4450
          TURNER          1500    5950    5950
          WARD         1250    8450    8450
          MARTIN          1250    8450    8450
          JAMES         950    9400    9400

       20 SCOTT         3000    6000    15400
          FORD         3000    6000    15400
          JONES         2975    8975    18375
          ADAMS         1100    10075    19475
          SMITH         800    10875    20275

       10 KING         5000    5000    25275
          CLARK         2450    7450    27725
          MILLER          1300    8750    29025


已选择14行。



6.
体会:在"... from emp;"后面不要加order  by 子句,使用的分析函数的(partition by deptno order by sal)
里已经有排序的语句了,如果再在句尾添加排序子句,一致倒罢了,不一致,结果就令人费劲了。如:

SQL> select deptno,ename,sal,sum(sal) over (partition by deptno order bysal) dept_sum,
   2   sum(sal) over (order by deptno,sal) sum
   3   from emp
   4   order by deptno desc;

DEPTNO ENAME          SAL DEPT_SUM       SUM
---------- ---------- ---------- ---------- ----------
       30 JAMES         950        950    20575
          WARD         1250    3450    23075
          MARTIN          1250    3450    23075
          TURNER          1500    4950    24575
          ALLEN         1600    6550    26175
          BLAKE         2850    9400    29025

       20 SMITH         800        800    9550
          ADAMS         1100    1900    10650
          JONES         2975    4875    13625
          SCOTT         3000    10875    19625
          FORD         3000    10875    19625

       10 MILLER          1300    1300    1300
          CLARK         2450    3750    3750
          KING         5000    8750    8750


已选择14

 

 

 

row_number() over ([partition by col1] order by col2) )as 别名
表示根据col1分组,在分组内部根据 col2排序
而这个“别名”的值就表示每组内部排序后的顺序编号(组内连续的唯一的),[partition by col1] 可省略。

以Scott/tiger登陆,以emp表为例。

1、select deptno,ename,sal,
     sum(sal) over (order by ename) 累计, --按姓名排序,并将薪水逐个累加
     sum(sal) over () 总和,              -- 此处sum(sal) over () 等同于sum(sal),求薪水总和
    100*round(sal/sum(sal) over (),4) "份额(%)" --求每个人的薪水占总额的比例,小数点后保留2位,括号和百分号为特殊符号,所以需要“”
    from emp

结果如下 :

2、select deptno,ename,sal,
sum(sal) over (partition by deptno order by ename) 部门连续求和,--partition by deptno先按部门分组,再按姓名排序,并将薪水逐个累加
sum(sal) over (partition by deptno) 部门总和,  -- 每个部门的薪水总和
100*round(sal/sum(sal) over (partition by deptno),4) "部门份额(%)",--每个员工在各自部门的薪水比例
sum(sal) over (order by deptno,ename) 连续求和, --所有部门的薪水"连续"求和
sum(sal) over () 总和,   -- 此处sum(sal) over () 等同于sum(sal),所有员工的薪水总和
100*round(sal/sum(sal) over (),4) "总份额(%)" --求每个人的薪水占总额的比例
from emp

结果如下:

3、select deptno,ename,sal,sum(sal)over (partition by deptno order by sal) dept_sum,--根据部门分组,再按部门内的个人薪水排序,逐个累加。
sum(sal) over (order by deptno,sal) sum --按部门排序,将薪水逐个累加。
from emp;

结果如下:

4、部门从大到小排列,部门里各员工的薪水从高到低排列

select deptno,ename,sal,
   sum(sal) over (partition by deptno order by deptno desc,sal desc)dept_sum,--按部门分组后,按部门和薪水降序排
   sum(sal) over (order by deptno desc,sal desc) sum --按部门和薪水降序排
   from emp;

结果如下:


       

5、将各部门的员工按薪水排序

select ename,job,deptno,sal,(row_number() over(partition by deptno orderby sal desc)) as 排名 --先按部门分组,再在部门中按薪水降序排名
from scott.emp

结果如下:

6、查找各部门中薪水最高的前2位

select ename,job,deptno,sal,排名 from
(select ename,job,deptno,sal,(row_number() over(partition by deptno order by saldesc)) as 排名 
fromscott.emp                  --先将各部门的员工按薪水排序,再在结果中取出需要的部分
) where 排名<=2;

结果如下:

7、如果已经在over()中进行过分组,在"... from emp;"后面不要加order  by 子句。

 

 

step 3 利用sys_connect_by_path生成结果集:

SELECTcountry,sys_connect_by_path(city,',') city
FROM
(SELECT country,city,country||
rn rchild,country||(rn-1) rfather
FROM
(SELECTtest.country,test.city,row_number()
over (PARTITION BY test.country ORDER BY
test.city) rn
FROM test))
CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0'
日本 ,大阪
日本 ,大阪,东京
中国 ,上海
中国 ,上海,台北
中国 ,上海,台北,香港

  step 4 最终步骤,筛选结果集合:

SQL>SELECT country,max(substr(city,2)) city
2FROM
3(SELECTcountry,sys_connect_by_path(city,',') city
4FROM
5(SELECTcountry,city,country||rn rchild,country||
(rn-1) rfather
6FROM
7(SELECTtest.country,test.city,row_number()
over (PARTITION BY test.country ORDER
BY test.city) rn
8FROMtest))
9CONNECTBY PRIOR rchild=rfather START WITH rfather LIKE '%0')
10
 GROUP BY country;
COUNTRY
CITY
-------------------- -------
中国        上海,台北,香港
日本        大阪,东京

 

 

 怎么合并多行记录的字符串,我同事曾经建议我用FUNCTION来实现,但是我的报表中有多个类似的字段需要合并,因此我想用最简单的方法来操作,没接受此方案,今天在网上看到这样一篇文章,实在是太高兴了,而且还使用到了partition和聚集,这样更能丰富合并多行记录的处理方法.

        下面就合并多行字符串贴出刚刚在网上搜到的一个好贴!
        什么是合并多行字符串(连接字符串)呢,例如:
SQL> desc test;
Name    Type         Nullable Default Comments 
------- ------------ -------- ------- -------- 
COUNTRY VARCHAR2(20) Y                         
CITY    VARCHAR2(20) Y                         

SQL> select * from test;

COUNTRY              CITY
-------------------- --------------------
中国                 台北
中国                 香港
中国                 上海
日本                 东京
日本                 大阪
要求得到如下结果集:
-------    --------------------
中国       台北,香港,上海
日本       东京,大阪
  实际就是对字符实现一个聚合功能,我很奇怪为什么Oracle没有提供官方的聚合函数来实现它呢:)
  下面就对几种经常提及的解决方案进行分析(有一个评测标准最高★★★★★):
1.被集合字段范围小且固定型 灵活性★   性能★★★★ 难度 ★
  这种方法的原理在于你已经知道CITY字段的值有几种,且还不算太多,如果太多这个SQL就会相当的

长。。看例子:
SQL> select t.country,
  2  MAX(decode(t.city,'台北',t.city||',',NULL)) ||
  3  MAX(decode(t.city,'香港',t.city||',',NULL))||
  4  MAX(decode(t.city,'上海',t.city||',',NULL))||
  5  MAX(decode(t.city,'东京',t.city||',',NULL))||
  6  MAX(decode(t.city,'大阪',t.city||',',NULL))
  7  from test t GROUP BY t.country
  8  /

COUNTRY              MAX(DECODE(T.CITY,'台北',T.CIT
-------------------- ------------------------------
中国                 台北,香港,上海,
日本                 东京,大阪,
  大家一看,估计就明白了(如果不明白,好好补习MAX DECODE和分组)。这种方法无愧为最笨的方法

,但是对某些应用来说,最有效的方法也许就是它。
2.固定表固定字段函数法 灵活性★★ 性能★★★★ 难度 ★★
  此法必须预先知道是哪个表,也就是说一个表就得写一个函数,不过方法1的一个取值就要便捷多了。在大多数应用中,也不会存在大量这种合并字符串的需求。废话完毕,看下面:
  定义一个函数
create or replace function str_list( str_in in varchar2 )--分类字段
  return varchar2
is
      str_list  varchar2(4000) default null;--连接后字符串
      str  varchar2(20) default null;--连接符号
begin
      for x in ( select TEST.CITY from TEST where TEST.COUNTRY = str_in ) loop
          str_list := str_list || str || to_char(x.city);
          str := ', ';
      end loop;
      return str_list;
end;
使用:
SQL> select DISTINCT(T.country),list_func1(t.country) from test t;

COUNTRY              LIST_FUNC1(T.COUNTRY)
-------------------- ----------------
中国                 台北, 香港, 上海
日本                 东京, 大阪

SQL> select t.country,str_list(t.country) from test t GROUP BY t.country;

COUNTRY              STR_LIST(T.COUNTRY)
-------------------- -----------------------
中国                 台北, 香港, 上海
日本                 东京, 大阪
这个时候,使用分组和求唯一都可以满足要求。它的原理就是,根据唯一的分组字段country,在函数里面再次查询该字段对应的所有被合并列,使用PL/SQL将其合并输出。
3.灵活表函数法 灵活性★★★ 性能★★★ 难度 ★★★
  该方法是在方法2的基础上,使用动态SQL,将表名和字段名称传入,从而达到灵活的目的。
  create or replace function str_list2( key_name in varchar2,
                    key  in varchar2,
                    coname in varchar2,
                    tname     in varchar2 )
 return varchar2
as
    type rc is ref cursor;
    str    varchar2(4000);
    sep    varchar2(2);
    val    varchar2(4000);
    cur    rc;
begin
    open cur for 'select '||coname||'
                    from '|| tname || '
                    where ' || key_name || ' = :x '
                using key;
    loop
        fetch cur into val;
        exit when cur%notfound;
        str := str || sep || val;
        sep := ', ';
    end loop;
    close cur;
    return str;
end;
SQL> select test.country,
  2  str_list2('COUNTRY', test.country, 'CITY', 'TEST') emplist
  3  from test
  4   group by test.country
  5  /

COUNTRY              EMPLIST
-------------------- -----------------
中国                 台北, 香港, 上海
日本                 东京, 大阪
4.一条SQL法 灵活性★★★★ 性能★★ 难度 ★★★★
  一条SQL的法则是某位大师提出的,大家曾经在某个时期都乐此不彼的寻求各种的问题一条SQL法,但是大师的意思似乎被曲解,很多性能差,可读性差,灵活差的SQL都是这个原则产物,所谓画虎不成反成犬类。不过,解决问题始终是第一原则,这里还是给出一个比较有代表性的一条SQL方法。
SELECT country,max(substr(city,2)) city
  FROM
(SELECT country,sys_connect_by_path(city,',') city
 FROM 
(SELECT country,city,country||rn rchild,country||(rn-1) rfather
  FROM 
  (SELECT  test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY 

test.city) rn 
  FROM test))
CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0')
 GROUP BY country;
  下面分步解析,有4个FROM,就有4次结果集的操作。
   step 1 给记录加上序号rn
  SQL> SELECT  test.country ,test.city,row_number() over (PARTITION BY test.country ORDER 

BY test.city) rn
  2    FROM test
  3  /

COUNTRY              CITY                         RN
-------------------- -------------------- ----------
日本                 大阪                          1
日本                 东京                          2
中国                 上海                          1
中国                 台北                          2
中国                 香港                          3
  step 2 创造子节点父节点
SQL> SELECT country,city,country||rn rchild,country||(rn-1) rfather
  2    FROM
  3    (SELECT  test.country ,test.city,row_number() over (PARTITION BY test.country ORDER 

BY test.city) rn
  4    FROM test)
  5  /
 日本 大阪 日本1 日本0
 日本 东京 日本2 日本1
 中国 上海 中国1 中国0
 中国 台北 中国2 中国1
 中国 香港 中国3 中国2
  step 3 利用sys_connect_by_path生成结果集
SELECT country,sys_connect_by_path(city,',') city
 FROM 
(SELECT country,city,country||rn rchild,country||(rn-1) rfather
  FROM 
  (SELECT  test.country ,test.city,row_number() over (PARTITION BY test.country ORDER BY 

test.city) rn 
  FROM test))
CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0'
 日本 ,大阪
 日本 ,大阪,东京
 中国 ,上海
 中国 ,上海,台北
 中国 ,上海,台北,香港
  step 4 最终步骤,筛选结果集合
SQL> SELECT country,max(substr(city,2)) city
  2    FROM
  3  (SELECT country,sys_connect_by_path(city,',') city
  4   FROM
  5  (SELECT country,city,country||rn rchild,country||(rn-1) rfather
  6    FROM
  7    (SELECT  test.country ,test.city,row_number() over (PARTITION BY test.country ORDER 

BY test.city) rn
  8    FROM test))
  9  CONNECT BY PRIOR rchild=rfather START WITH rfather LIKE '%0')
 10   GROUP BY country;

COUNTRY              CITY
-------------------- -------
中国                 上海,台北,香港
日本                 大阪,东京

  可谓是,7歪8搞,最后还是弄出来了,呵呵。
5.自定义聚合函数 灵活性★★★★★ 性能★★★★★ 难度 ★★★★★
  最后一个方法是我认为“王道”的方法,自定义聚合函数。
  就如何我在本开始说的,为啥oracle没有这种聚合函数呢?我也不知道,但oracle提供了聚合函数的

API可以让我方便的自己定义聚合函数。
  详细可以看Oracle Data Catridge guide这个文档。连接如下:
  http://www.oracle.com.cn/other/9ionlinedoc/appdev.920/a96595/toc.htm
下面给出一个简单的例子:
SQL> SELECT t.country,strcat(t.city) FROM test t GROUP BY t.country;

COUNTRY              STRCAT(T.CITY)
-------------------- ------------------
日本                 东京,大阪
中国                 台北,香港,上海
简单吧,和官方的函数一样的便捷高效。
函数:
CREATE OR REPLACE FUNCTION strcat(input varchar2 )
RETURN varchar2
PARALLEL_ENABLE AGGREGATE USING strcat_type;
TYPE:
create or replace type strcat_type as object (
    cat_string varchar2(4000),
    static function ODCIAggregateInitialize(cs_ctx In Out strcat_type) return number,
    member function ODCIAggregateIterate(self In Out strcat_type,value in varchar2) return 

number,
    member function ODCIAggregateMerge(self In Out strcat_type,ctx2 In Out strcat_type) 

return number,
    member function ODCIAggregateTerminate(self In Out strcat_type,returnValue Out 

varchar2,flags in number) return number
)



分析函数2(Rank, Dense_rank, row_number)

 

目录
===============================================
1.使用rownum为记录排名
2.使用分析函数来为记录排名
3.使用分析函数为记录进行分组排名

一、使用rownum为记录排名:

在前面一篇《Oracle开发专题之:分析函数》,我们认识了分析函数的基本应用,现在我们再来考虑下面几个问题:

对所有客户按订单总额进行排名
按区域和客户订单总额进行排名
找出订单总额排名前13位的客户
找出订单总额最高、最低的客户
找出订单总额排名前25%的客户


按照前面第一篇文章的思路,我们只能做到对各个分组的数据进行统计,如果需要排名的话那么只需要简单地加上rownum不就行了吗?事实情况是否如此想象般简单,我们来实践一下。

1】测试环境:

SQL> desc user_order;
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 REGION_ID                                          NUMBER(2)
 CUSTOMER_ID                                  NUMBER(2)
 CUSTOMER_SALES                          NUMBER


2】测试数据:

SQL> select * from user_order order by customer_sales;

 REGION_ID CUSTOMER_ID CUSTOMER_SALES
---------- ----------- --------------
         5           1              151162
        10          29             903383
         6           7              971585
        10          28            986964
         9          21           1020541
         9          22           1036146
         8          16           1068467
         6           8            1141638
         5           3            1161286
         5           5            1169926
         8          19           1174421
         7          12           1182275
         7          11           1190421
         6          10           1196748
         6           9            1208959
        10          30          1216858
         5             2                1224992
           9             24              1224992
           9             23              1224992
           
8          18           1253840
         7          15           1255591
         7          13           1310434
        10          27          1322747
         8          20           1413722
         6           6            1788836
        10          26          1808949
         5           4            1878275
         7          14           1929774
         8          17           1944281
         9          25           2232703

30
 rows selected.


注意这里有3条记录的订单总额是一样的。假如我们现在需要筛选排名前12位的客户,如果使用rownum会有什么样的后果呢?

SQL> select rownum, t.*
  2    from (select * 
  3            from user_order
  4           order by customer_sales desc) t
  5   where rownum <= 12
  6
   order by customer_sales desc;

    ROWNUM  REGION_ID CUSTOMER_ID CUSTOMER_SALES
---------- ---------- ----------- --------------
         1          9                 25        2232703
         2          8                 17        1944281
         3          7                 14        1929774
         4          5                   4        1878275
         5         10                26        1808949
         6          6                   6        1788836
         7          8                 20        1413722
         8         10                27        1322747
         9          7                13        1310434
        10          7               15        1255591
        11          8               18        1253840
          12             5                     2          1224992

12
 rows selected.


很明显假如只是简单地按rownum进行排序的话,我们漏掉了另外两条记录(参考上面的结果)

二、使用分析函数来为记录排名:

针对上面的情况,Oracle8i开始就提供了3个分析函数:randdense_rankrow_number来解决诸如此类的问题,下面我们来看看这3个分析函数的作用以及彼此之间的区别:

Rank
Dense_rankRow_number函数为每条记录产生一个从1开始至N的自然数,N的值可能小于等于记录的总数。这3个函数的唯一区别在于当碰到相同数据时的排名策略。

ROW_NUMBER

Row_number函数返回一个唯一的值,当碰到相同数据时,排名按照记录集中记录的顺序依次递增。 

DENSE_RANK
Dense_rank函数返回一个唯一的值,除非当碰到相同数据时,此时所有相同数据的排名都是一样的。 

RANK
Rank函数返回一个唯一的值,除非遇到相同的数据时,此时所有相同数据的排名是一样的,同时会在最后一条相同记录和下一条不同记录的排名之间空出排名。

这样的介绍有点难懂,我们还是通过实例来说明吧,下面的例子演示了3个不同函数在遇到相同数据时不同排名策略:

SQL> select region_id, customer_id, sum(customer_sales) total,
  2         rank() over(order by sum(customer_sales) desc) rank,
  3         dense_rank() over(order by sum(customer_sales) desc) dense_rank,
  4         row_number() over(order by sum(customer_sales) desc) row_number
  5    from user_order
  6   group by region_id, customer_id;

 REGION_ID CUSTOMER_ID      TOTAL       RANK DENSE_RANK ROW_NUMBER
---------- ----------- ---------- ---------- ---------- ----------
            
         8          18                1253840         11         11         11
         5           2                 1224992         12         12         12
         9          23                1224992         12         12         13
         9          24                1224992         12         12         14
        10          30               1216858         15           13            15
    

30
 rows selected.


请注意上面的绿色高亮部分,这里生动的演示了3种不同的排名策略:

对于第一条相同的记录,3种函数的排名都是一样的:12

当出现第二条相同的记录时,RankDense_rank依然给出同样的排名12;而row_number则顺延递增为13,依次类推至第三条相同的记录

当排名进行到下一条不同的记录时,可以看到Rank函数在1215之间空出了13,14的排名,因为这2个排名实际上已经被第二、三条相同的记录占了。而Dense_rank则顺序递增。row_number函数也是顺序递增

比较上面3种不同的策略,我们在选择的时候就要根据客户的需求来定夺了:

假如客户就只需要指定数目的记录,那么采用row_number是最简单的,但有漏掉的记录的危险

假如客户需要所有达到排名水平的记录,那么采用rankdense_rank是不错的选择。至于选择哪一种则看客户的需要,选择dense_rank或得到最大的记录

三、使用分析函数为记录进行分组排名:

上面的排名是按订单总额来进行排列的,现在跟进一步:假如是为各个地区的订单总额进行排名呢?这意味着又多了一次分组操作:对记录按地区分组然后进行排名。幸亏Oracle也提供了这样的支持,我们所要做的仅仅是在over函数中order by的前面增加一个分组子句:partition by region_id

SQL> select region_id, customer_id, 
               sum(customer_sales) total,
  2         rank() over(partition by region_id
                        order by sum(customer_sales) desc) rank,
  3         dense_rank() over(partition by region_id
                        order by sum(customer_sales) desc) dense_rank,
  4         row_number() over(partition by region_id
                        order by sum(customer_sales) desc) row_number

  5    from user_order
  6   group by region_id, customer_id;

 REGION_ID CUSTOMER_ID      TOTAL       RANK DENSE_RANK ROW_NUMBER
---------- ----------- ---------- ---------- ---------- ----------
         5           4                1878275          1          1          1
         5           2                1224992          2          2          2
         5           5                1169926          3          3          3
         6           6                1788836          1          1          1
         6           9                1208959          2          2          2
         6          10               1196748          3          3          3       
  

30
 rows selected.


现在我们看到的排名将是基于各个地区的,而非所有区域的了! Partition by  子句在排列函数中的作用是将一个结果集划分成几个部分,这样排列函数就能够应用于这各个子集。

前面我们提到的 5 个问题已经解决了 2 个了 ( 1,2) ,剩下的 3 个问题 (Top/Bottom N First/Last, NTile) 会在下一篇讲解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值