oracle start with connect by 用法

今天读到了一篇关于 “oracle start with connect by 用法”的通俗易懂的文章,写的很好,故转摘过来学习(http://hi.baidu.com/a889275/item/1ebf2780b48e72e3e596e048

oracle中connectbyprior递归算法

Oracle中startwith...connectbyprior子句用法connectby是结构化查询中用到的,其基本语法是:
select...fromtablenamestartwith条件1
connectby条件2
where条件3;
例:
select*fromtable
startwithorg_id='HBHqfWGWPy'
connectbypriororg_id=parent_id;

简单说来是将一个树状结构存储在一张表里,比如一个表中存在两个字段:
org_id,parent_id那么通过表示每一条记录的parent是谁,就可以形成一个树状结构。
用上述语法的查询可以取得这棵树的所有记录。
其中:
条件1是根结点的限定语句,当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。
条件2是连接条件,其中用PRIOR表示上一条记录,比如CONNECTBYPRIORorg_id=parent_id就是说上一条记录的org_id是本条记录的parent_id,即本记录的父亲是上一条记录。
条件3是过滤条件,用于对返回的所有记录进行过滤。

简单介绍如下:
早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下:
第一步:从根节点开始;
第二步:访问该节点;
第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步;
第四步:若该节点为根节点,则访问完毕,否则执行第五步;
第五步:返回到该节点的父节点,并执行第三步骤。

总之:扫描整个树结构的过程也即是中序遍历树的过程。

1.树结构的描述
树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。
在SELECT命令中使用CONNECTBY和蔼STARTWITH子句可以查询表中的树型结构关系。其命令格式如下:
SELECT。。。
CONNECTBY{PRIOR列名1=列名2|列名1=PRIOR裂名2}
[STARTWITH];
其中:CONNECTBY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使用列名外,还允许使用列表达式。STARTWITH子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。
STARTWITH:不但可以指定一个根节点,还可以指定多个根节点。
2.关于PRIOR
运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。
PRIOR被置于CONNECTBY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
CONNECTBYPRIOREMPNO=MGR
PIROR运算符被置于CONNECTBY子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如:
CONNECTBYEMPNO=PRIORMGR
在这种方式中也应指定一个开始的节点。
3.定义查找起始节点
在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。
4.使用LEVEL
在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2,依此类推。
5.节点和分支的裁剪
在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。
6.排序显示
象在其它查询中一样,在树结构查询中也可以使用ORDERBY子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序

----------------------------------------------------------------------------------------------------------

oracle提供了startwithconnectby语法结构可以实现递归查询。

1.一个简单举例:
SQL>select*fromtest;

BILL_MONTHDAY_NUMBERMSISDN
--------------------------------------------------
200803113800
200803313800
200803213800
200803213801
200803413804
200803513804
200803713804
200803813804
200803613802
200803613801
200803713801
200803813801

12rowsselected

SQL>
SQL>select*fromtest
2startwithday_number=1
3connectbypriorday_number=day_number-1andpriormsisdn=msisdn
4;

BILL_MONTHDAY_NUMBERMSISDN
--------------------------------------------------
200803113800
200803213800
200803313800

SQL>


上面的语句查找出了从1开始,并且day_number逐渐+1递增的,并且msisdn相同的哪些个数据.


2.startwithconnectby语法结构
如上面说看到的例子,其语法结构为startwithconditionconnectbycondition(含prior关键字)
startwithconditon给出的seed数据的范围,connectby后面给出了递归查询的条件,prior关键字表示父数据,prior条件表示子数据需要满足父数据的什么条件。

在下面的这个startwithconnectby结构中,就表示查找出了从1开始,并且day_number逐渐+1递增的,并且msisdn相同的那些个数据.

startwithday_number=1
connectbypriorday_number=day_number-1andpriormsisdn=msisdn

3.执行计划
对于这个特殊的语法结构,我们来看看它的执行计划。
通过下面的执行计划,我们可以看出,对于简单的访问一个对象的递归查询,实际上oracle要三次访问要查询的对象。因此,这一个告诉我们,在使用递归查询时,一定要谨慎,因为即使原表数据不多,但是三倍的访问喜爱来,代价也会很大。

SQL>explainplanfor
2
2select*fromtest
3--wherebill_month='200803'
4startwithday_number=1
5connectbypriorday_number=day_number-1andpriormsisdn=msisdn
6;

Explained

SQL>select*fromtable(dbms_xplan.display);

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
-------------------------------------------------------------------------
|Id|Operation|Name|Rows|Bytes|Cost|
-------------------------------------------------------------------------
|0|SELECTSTATEMENT|||||
|*1|CONNECTBYWITHFILTERING|||||
|*2|FILTER|||||
|3|TABLEACCESSFULL|TEST||||
|4|NESTEDLOOPS|||||
|5|BUFFERSORT|||||
|6|CONNECTBYPUMP|||||
|*7|TABLEACCESSFULL|TEST||||
|8|TABLEACCESSFULL|TEST||||
-------------------------------------------------------------------------
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
1-filter("TEST"."DAY_NUMBER"=1)
2-filter("TEST"."DAY_NUMBER"=1)

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
7-filter("TEST"."MSISDN"=NULLAND"TEST"."DAY_NUMBER"-1=NULL)
Note:rulebasedoptimization

23rowsselected

SQL>


另外,发现了在含有其他条件的递归中,是先处理所有的递归查询,最后才用加入的条件过滤.
请看下面的例子。
和上面的执行计划对比下我们可以知道,加入条件wherebill_month='200803'后,实际上却是在递归完成后,最后才执行的1-filter("TEST"."BILL_MONTH"='200803')。

所以,为了确保语句的性能,不要直接加入条件在startwithconnectby结构中,而是要想办法将原表的数据控制住。这个可以采用子查询的办法,或者使用临时表等(最好采用临时表,将数据量从本源上控制住;因为从子查询的执行计划我们可以看到,它每次也都是访问全表,再用条件过滤,要重复三次,不是一次过滤就够了).

--直接加入条件后的执行计划
SQL>explainplanfor
2
2select*fromtest
3wherebill_month='200803'
4startwithday_number=1
5connectbypriorday_number=day_number-1andpriormsisdn=msisdn
6;

Explained

SQL>select*fromtable(dbms_xplan.display);

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
--------------------------------------------------------------------------
|Id|Operation|Name|Rows|Bytes|Cost|
--------------------------------------------------------------------------
|0|SELECTSTATEMENT|||||
|*1|FILTER|||||
|*2|CONNECTBYWITHFILTERING|||||
|*3|FILTER|||||
|4|TABLEACCESSFULL|TEST||||
|5|NESTEDLOOPS|||||
|6|BUFFERSORT|||||
|7|CONNECTBYPUMP|||||
|*8|TABLEACCESSFULL|TEST||||
|9|TABLEACCESSFULL|TEST||||
--------------------------------------------------------------------------
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
1-filter("TEST"."BILL_MONTH"='200803')

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
2-filter("TEST"."DAY_NUMBER"=1)
3-filter("TEST"."DAY_NUMBER"=1)
8-filter("TEST"."MSISDN"=NULLAND"TEST"."DAY_NUMBER"-1=NULL)
Note:rulebasedoptimization

25rowsselected

SQL>


--使用子查询,将过滤条件嵌在子查询中
SQL>explainplanfor
2
2select*from(select*fromtest
3wherebill_month='200803')
4startwithday_number=1
5connectbypriorday_number=day_number-1andpriormsisdn=msisdn
6;

Explained

SQL>select*fromtable(dbms_xplan.display);

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
-------------------------------------------------------------------------
|Id|Operation|Name|Rows|Bytes|Cost|
-------------------------------------------------------------------------
|0|SELECTSTATEMENT|||||
|*1|CONNECTBYWITHFILTERING|||||
|*2|FILTER|||||
|*3|TABLEACCESSFULL|TEST||||
|4|NESTEDLOOPS|||||
|5|BUFFERSORT|||||
|6|CONNECTBYPUMP|||||
|*7|TABLEACCESSFULL|TEST||||
|*8|TABLEACCESSFULL|TEST||||
-------------------------------------------------------------------------
PredicateInformation(identifiedbyoperationid):
---------------------------------------------------
1-filter("TEST"."DAY_NUMBER"=1)
2-filter("TEST"."DAY_NUMBER"=1)

PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
3-filter("TEST"."BILL_MONTH"='200803')
7-filter("TEST"."BILL_MONTH"='200803'AND"TEST"."MSISDN"=NULLAND
"TEST"."DAY_NUMBER"-1=NULL)
8-filter("TEST"."BILL_MONTH"='200803')
Note:rulebasedoptimization

26rowsselected

SQL>



4.实际中递归查询的使用。

问题:
数据库里有字段day_number,msisdn。如何写月度连续3天有记录的手机号?表结构如下:

idbill_monthday_numbermsisdn
1200803113800000000
22008031130137.....
3200803213800000000
4200803313800000000
..............................

表中3月份连续3天有记录的纪录就是1380000000。请问如何写这样的sql?


解决方案:
SQL>createtabletest(bill_monthvarchar2(20),day_numbernumber,msisdnvarchar2(20));

Tablecreated

SQL>insertintotestvalues('200803',1,'13800');

1rowinserted

SQL>insertintotestvalues('200803',3,'13800');

1rowinserted

SQL>insertintotestvalues('200803',2,'13800');

1rowinserted

SQL>insertintotestvalues('200803',2,'13801');

1rowinserted

SQL>insertintotestvalues('200803',4,'13804');

1rowinserted

SQL>insertintotestvalues('200803',5,'13804');

1rowinserted

SQL>commit;

Commitcomplete

SQL>select*fromtest;

BILL_MONTHDAY_NUMBERMSISDN
--------------------------------------------------
200803113800
200803313800
200803213800
200803213801
200803413804
200803513804

6rowsselected

SQL>
SQL>selectdistinctmsisdnfromtesta
2wherebill_month='200803'
3andexists
4(selectmsisdnfromtest
5wherebill_month='200803'andmsisdn=a.msisdn
6startwithday_number=a.day_number
7connectbypriorday_number=day_number-1andpriormsisdn=msisdn
8groupbymsisdn
9havingcount(*)>=3
10);

MSISDN
--------------------
13800


SQL>select*fromtest;

BILL_MONTHDAY_NUMBERMSISDN
--------------------------------------------------
200803113800
200803313800
200803213800
200803213801
200803413804
200803513804

6rowsselected

SQL>insertintotestvalues('200803',7,'13804');

1rowinserted

SQL>insertintotestvalues('200803',8,'13804');

1rowinserted

SQL>insertintotestvalues('200803',6,'13802');

1rowinserted

SQL>insertintotestvalues('200803',6,'13801');

1rowinserted

SQL>insertintotestvalues('200803',7,'13801');

1rowinserted

SQL>insertintotestvalues('200803',8,'13801');

1rowinserted

SQL>select*fromtest;

BILL_MONTHDAY_NUMBERMSISDN
--------------------------------------------------
200803113800
200803313800
200803213800
200803213801
200803413804
200803513804
200803713804
200803813804
200803613802
200803613801
200803713801
200803813801

12rowsselected

SQL>commit;

Commitcomplete

SQL>
SQL>selectdistinctmsisdnfromtesta
2wherebill_month='200803'
3andexists
4(selectmsisdnfromtest
5wherebill_month='200803'andmsisdn=a.msisdn
6startwithday_number=a.day_number
7connectbypriorday_number=day_number-1andpriormsisdn=msisdn
8groupbymsisdn
9havingcount(*)>=3
10);

MSISDN
--------------------
13800
13801

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值