Oracle 正则表达式

Oracle 10g数据库内建了符合IEEE POSIX (Portable Operating System for Unix)标准的正则表达式。熟练使用正则表达式,可以写出简洁,强大的SQL语句。

正则表达式有几个优点优于常见的LIKE操作符和INSTRSUBSTRREPLACE 函数的。这些传统的SQL 函数不便于进行模式匹配。只有LIKE 操作符通过使用%_字符匹配,但LIKE不支持表达式的重复、复杂的更替、字符范围、字符列表和POSIX 字符类等等。

元字符(Meta Character):

^             使表达式定位至一行的开头   

$             使表达式定位至一行的末尾   

*             匹配 0 次或更多次   

?             匹配 0 次或 1    

+             匹配 1 次或更多次   

{m}           正好匹配 m    

{m,}          至少匹配 m    

{m, n}        至少匹配 m 次但不超过 n    

[:alpha:]     字母字符   

[:lower:]     小写字母字符   

[:upper:]     大写字母字符   

[:digit:]     数字   

[:alnum:]     字母数字字符   

[:space:]     空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符[:punct:]     标点字符   

[:cntrl:]     控制字符(禁止打印)   

[:print:]     可打印字符 | 分隔替换选项,通常与分组操作符 () 一起使用   

( )           将子表达式分组为一个替换单元、量词单元或后向引用单元   

[char]        字符列表  

Oracle 10g提供了四个regexp function: REGEXP_LIKE , REGEXP_REPLACE , REGEXP_INSTR , REGEXP_SUBSTR

REGEXP_LIKE:比较一个字符串是否与正则表达式匹配   

(srcstr, pattern [, match_option])   

  

REGEXP_INSTR:在字符串中查找正则表达式,并且返回匹配的位置   

(srcstr, pattern [, position [, occurrence [, return_option [, match_option]]]])   

  

REGEXP_SUBSTR:返回与正则表达式匹配的子字符串   

(srcstr, pattern [, position [, occurrence [, match_option]]])   

  

REGEXP_REPLACE:搜索并且替换匹配的正则表达式   

(srcstr, pattern [, replacestr [, position [, occurrence [, match_option]]]])  

REGEXP_LIKE:比较一个字符串是否与正则表达式匹配

(srcstr, pattern [, match_option])

 

REGEXP_INSTR:在字符串中查找正则表达式,并且返回匹配的位置

(srcstr, pattern [, position [, occurrence [, return_option [, match_option]]]])

 

REGEXP_SUBSTR:返回与正则表达式匹配的子字符串

(srcstr, pattern [, position [, occurrence [, match_option]]])

 

REGEXP_REPLACE:搜索并且替换匹配的正则表达式

(srcstr, pattern [, replacestr [, position [, occurrence [, match_option]]]])其中各参数的含义为:

srcstr:         被查找的字符数据。   

pattern:        正则表达式。   

occurrence:     出现的次数。默认为1   

position:       开始位置   

return_option: 默认值为0,返回该模式的起始位置;值为1则返回符合匹配条件的下一个字符的起始位置。   

replacestr:     用来替换匹配模式的字符串。   

match_option:   匹配方式选项。缺省为c   

                ccase sensitive   

                Icase insensitive  

                n(.)匹配任何字符(包括newline)   

                m:字符串存在换行的时候被作为多行处理  

srcstr:        被查找的字符数据。

pattern:       正则表达式。

occurrence:    出现的次数。默认为1

position:      开始位置

return_option: 默认值为0,返回该模式的起始位置;值为1则返回符合匹配条件的下一个字符的起始位置。

replacestr:    用来替换匹配模式的字符串。

match_option:  匹配方式选项。缺省为c

               ccase sensitive

               Icase insensitive

               n(.)匹配任何字符(包括newline)

               m:字符串存在换行的时候被作为多行处理下面通过一些具体的例子来说明如何使用这四个函数。首先创建一个测试数据表,

/* Formatted on 3/22/2012 2:42:16 PM (QP5 v5.149.1003.31008) */

CREATE TABLE person

(

   first_name   VARCHAR (20),

   last_name    VARCHAR (20),

   email        VARCHAR (100),

   zip          VARCHAR (6)

);

 

INSERT INTO person

     VALUES ('Steven',

             'Chen',

             'steven@hp.com',

             '123456');

 

INSERT INTO person

     VALUES ('James',

             'Li',

             'jamesli@sun.com' || CHR (10) || 'lijames@oracle.com',

             '1b3d5f');

 

SELECT * FROM person;

 

 

1REGEXP_LIKE

select zip as invalid_zip from person where regexp_like(zip, '[^[:digit:]]');

 select first_name from person where regexp_like(first_name, '^S.*n$');

 select first_name from person where regexp_like(first_name, '^s.*n$');

 select first_name from person where regexp_like(first_name, '^s.*n$', 'c');    

 select first_name from person where regexp_like(first_name, '^s.*n$', 'i');

 select email from person where regexp_like(email, '^james.*com$'); 

 select email from person where regexp_like(email, '^james.*com$', 'n');

 select email from person where regexp_like(email, '^li.*com$');   

 select email from person where regexp_like(email, '^li.*com$', 'm');

 

注意上面分别测试了不同的match_option对结果的影响

2REGEXP_INSTR

--查找zip中第一个非数字字符的位置 

 select zip, regexp_instr(zip, '[^[:digit:]]'),as position from person;

--从第三个字符开始,查找zip中第二个非数字字符的位置

select zip,regexp_instr(zip, '[^[:digit:]]', 3, 2) as position from person;

--从第三个字符开始,查找zip中第二个非数字字符的下一个字符位置   

select zip,regexp_instr(zip, '[^[:digit:]]', 3, 2, 1) as position from person;

 

3REGEXP_SUBSTR

select zip, regexp_substr(zip, '[^[:digit:]]') as zip from person;   

select zip,regexp_substr(zip, '[^[:digit:]]', 3, 2) as zip from person

 

4REGEXP_REPLACE

update person set zip=regexp_replace(zip, '[^[:digit:]]', '0')   where regexp_like(zip, '[^[:digit:]]');

select * from person;

 

后向引用是一个很有用的特性。它能够把子表达式的匹配部分保存在临时缓冲区中,供以后重用。缓冲区从左至右进行编号,并利用 \digit 符号进行访问。子表达式用一组圆括号来显示。利用后向引用可以实现较复杂的替换功能。

selectregexp_replace('Steven Chen','(.*) (.*)','\2, \1')as reversed_name from dual;

 

DDL中也可以正则表达式,比如Constraint, index, view

 alter table person add constraint constraint_zip check (regexp_like(zip, '^[[:digit:]]+$'));    
 create index person_idx on person(regexp_substr(last_name, '^[[:upper:]]'));  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值