【转】Oracle正则表达式函数

'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹
配 '/n' 或 '/r'。
'.' 匹配除换行符之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'+' 匹配前面的子表达式一次或多次。
'*' 匹配前面的子表达式零次或多次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的
字符串。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少
出现m次。
/num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
字符簇: 
[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
/转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序




Oracle使用正则表达式离不开这4个函数:

1。regexp_like

2。regexp_substr

3。regexp_instr

4。regexp_replace

看函数名称大概就能猜到有什么用了。

regexp_like 只能用于条件表达式,和 like 类似,但是使用的正则表达式进行匹配,语法很简单:

regexp_like_condition

regexp_substr 函数,和 substr 类似,用于拾取合符正则表达式描述的字符子串,语法如下:

regexp_substr

regexp_instr 函数,和 instr 类似,用于标定符合正则表达式的字符子串的开始位置,语法如下:

regexp_instr

regexp_replace 函数,和 replace 类似,用于替换符合正则表达式的字符串,语法如下:

regexp_replace

这里解析一下几个参数的含义:

1。source_char,输入的字符串,可以是列名或者字符串常量、变量。

2。pattern,正则表达式。

3。match_parameter,匹配选项。

取值范围: i:大小写不敏感; c:大小写敏感;n:点号 . 不匹配换行符号;m:多行模式;x:扩展模式,忽略正则表达式中的空白字符。

4。position,标识从第几个字符开始正则表达式匹配。

5。occurrence,标识第几个匹配组。

6。replace_string,替换的字符串。

说了一堆文绉绉的,现在开始实例演练了,在此之前先建好一个表。

01 create table tmp as

02 with data as (

03   select 'like' as id ,'a9999' as str from dual union all

04   select 'like'       ,'a9c'          from dual union all

05   select 'like'       ,'A7007'        from dual union all

06   select 'like'       ,'123a34cc'     from dual union all

07   select 'substr'     ,'123,234,345'  from dual union all

08   select 'substr'     ,'12,34.56:78'  from dual union all

09   select 'substr'     ,'123456789'    from dual union all

10   select 'instr'      ,'192.168.0.1'  from dual union all

11   select 'replace'    ,'(020)12345678' from dual union all

12   select 'replace'    ,'001517729C28' from dual

13 )

14 select * from data ;

15

16 select * from tmp ;

17 ID      STR

18 ------- -------------

19 like    a9999

20 like    a9c

21 like    A7007

22 like    123a34cc

23 substr  123,234,345

24 substr  12,34.56:78

25 substr  123456789

26 instr   192.168.0.1

27 replace (020)12345678

28 replace 001517729C28

regexp_like 例子:

01 select str from tmp where id='like' and regexp_like(str,'A\d+','i'); -- 'i' 忽略大小写

02 STR

03 -------------

04 a9999

05 a9c

06 A7007

07 123a3

4cc

 

08

09 select str from tmp where id='like' and regexp_like(str, 'a\d+');

10 STR

11 -------------

12 a9999

13 a9c

14 123a34cc

15

16 select str from tmp where id='like' and regexp_like(str,'^a\d+');

17 STR

18 -------------

19 a9999

20 a9c

21

22 select str from tmp where id='like' and regexp_like(str,'^a\d+$');

23 STR

24 -------------

25 a9999

regexp_substr 例子:

01 col str format a15;

02 select

03   str,

04   regexp_substr(str,'[^,]+')     str,

05   regexp_substr(str,'[^,]+',1,1) str,

06   regexp_substr(str,'[^,]+',1,2) str,  -- occurrence 第几个匹配组

07   regexp_substr(str,'[^,]+',2,1) str   -- position 从第几个字符开始匹配

08 from tmp

09 where id='substr';

10 STR             STR             STR             STR             STR

11 --------------- --------------- --------------- --------------- ---------------

12 123,234,345     123             123             234             23

13 12,34.56:78     12              12              34.56:78        2

14 123456789       123456789       123456789                       23456789

15

16 select

17   str,

18   regexp_substr(str,'\d')        str,

19   regexp_substr(str,'\d+'  ,1,1) str,

20   regexp_substr(str,'\d{2}',1,2) str,

21   regexp_substr(str,'\d{3}',2,1) str

22 from tmp

23 where id='substr';

24 STR             STR             STR             STR             STR

25 --------------- --------------- --------------- --------------- ---------------

26 123,234,345     1               123             23              234

27 12,34.56:78     1               12              34

28 123456789       1               123456789       34              234

29

30

31 select regexp_substr('123456789','\d',1,level) str  --取出每位数字,有时这也是行转列的方式

32 from dual

33 connect by level<=9

34 STR

35 ---------------

36 1

37 2

38 3

39 4

40 5

41 6

42 7

43 8

44 9

regex_instr 例子:

01 col ind format 9999;

02 select

03   str,

04   regexp_instr(str,'\.'    ) ind ,

05   regexp_instr(str,'\.',1,2) ind ,

06   regexp_instr(str,'\.',5,2) ind

07 from tmp where id='instr';

08 STR               IND   IND   IND

09 --------------- ----- ----- -----

10 192.168.0.1         4     8    10

11

12 select

13   regexp_instr('192.168.0.1','\.',1,level) ind ,  -- 点号. 所在的位置

14   regexp_instr('192.168.0.1','\d',1,level) ind    -- 每个数字的位置

15 from dual

16 connect by level <=  9

17   IND   IND

18 ----- -----

19     4     1

20     8     2

21    10     3

22     0     5

23     0     6

24     0     7

25     0     9

26     0    11

27     0     0

regex_replace 例子:

01 select

02   str,

03   regexp_replace(str,'020','GZ') str,

04   regexp_replace(str,'(\d{3})(\d{3})','<\2\1>') str -- 将第一、第二捕获组交换位置,用尖括号标识出来

05 from tmp

06 where id='replace';

07 STR             STR             STR

08 --------------- --------------- ---------------

09 (020)12345678   (GZ)12345678    (020)<456123>78

10 001517729C28    001517729C28    <517001>729C28

综合应用的例子:

01 col row_line format a30;

02 with sudoku as (

03   select '020000080568179234090000010030040050040205090070080040050000060289634175010000020' as line

04   from dual

05 ),

06 tmp as (

07   select regexp_substr(line,'\d{9}',1,level) row_line,

08   level col

09   from sudoku

10   connect by level<=9

11 )

12 select regexp_replace( row_line ,'(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)','\1 \2 \3 \4 \5 \6 \7 \8 \9') row_line

13 from tmp

14

15 ROW_LINE

16 ------------------------------

17 0 2 0 0 0 0 0 8 0

18 5 6 8 1 7 9 2 3 4

19 0 9 0 0 0 0 0 1 0

20 0 3 0 0 4 0 0 5 0

21 0 4 0 2 0 5 0 9 0

22 0 7 0 0 8 0 0 4 0

23 0 5 0 0 0 0 0 6 0

24 2 8 9 6 3 4 1 7 5

25 0 1 0 0 0 0 0 2 0

REGEXP_SUBSTR函数格式如下:
function REGEXP_SUBSTR(String, pattern, position, occurrence, modifier)
__srcstr     :需要进行正则处理的字符串
__pattern    :进行匹配的正则表达式
__position   :起始位置,从第几个字符开始正则表达式匹配(默认为1)
__occurrence :标识第几个匹配组,默认为1
__modifier   :模式('i'不区分大小写进行检索;'c'区分大小写进行检索。默认为'c'。)

实际应用如下:在oracle中,使用一条语句实现将'34,56,-23'拆分成'34','56','-23'的集合。

 

[plain]  view plain copy
 
  1. --1、查询使用正则分割后的第一个值,也就是34  
  2. SELECT REGEXP_SUBSTR('34,56,-23','[^,]+',1,1,'i') AS STR FROM DUAL;  
  3. --结果是:34   
  4. --2、查询使用正则分割后的最后一个值,也就是-23  
  5. SELECT REGEXP_SUBSTR('34,56,-23','[^,]+',1,3,'i') AS STR FROM DUAL;  
  6. --结果是:-23  
  7. --3、获取一个多个数值的列,从而能够让结果以多行的形式展示出来  
  8. SELECT LEVEL FROM DUAL CONNECT BY LEVEL <=7;  
  9. --结果是:  
  10. --1  
  11. --2  
  12. --3  
  13. --4  
  14. --5  
  15. --6  
  16. --7  
  17. --4、将上面REGEXP_SUBSTR的occurrence关联  
  18. SELECT NVL(REGEXP_SUBSTR('34,56,-23', '[^,]+', 1, LEVEL, 'i'), 'NULLL') AS STR FROM DUAL CONNECT BY LEVEL <= 7;  
  19. --结果是:  
  20. --34  
  21. --56  
  22. ---23  
  23. --null  
  24. --null  
  25. --mull  
  26. --null  
  27. --5、优化上面的SQL语句,让生成的行的数量符合实际情况  
  28. SELECT REGEXP_SUBSTR('34,56,-23', '[^,]+', 1, LEVEL, 'i') AS STR FROM DUAL CONNECT BY LEVEL <= LENGTH('34,56,-23') - LENGTH(REGEXP_REPLACE('34,56,-23', ',', '')) + 1;  
  29. --结果是:  
  30. --34  
  31. --56  
  32. ---23  
 
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值