Oracle 正则表达式

原创 2012年03月22日 15:29:11

Oracle 10g数据库内建了符合IEEE POSIX (Portable Operating System for Unix)标准的正则表达式。熟练使用正则表达式,可以写出简洁,强大的SQL语句。

正则表达式有几个优点优于常见的LIKE操作符和INSTRSUBSTRREPLACE 函数的。这些传统的SQL 函数不便于进行模式匹配。只有LIKE 操作符通过使用%_字符匹配,但LIKE不支持表达式的重复、复杂的更替、字符范围、字符列表和POSIX 字符类等等。

元字符(Meta Character):

^             使表达式定位至一行的开头   

$             使表达式定位至一行的末尾   

*             匹配 0 次或更多次   

?             匹配 0 次或 1    

+             匹配 1 次或更多次   

{m}           正好匹配 m    

{m,}          至少匹配 m    

{m, n}        至少匹配 m 次但不超过 n    

[:alpha:]     字母字符   

[:lower:]     小写字母字符   

[:upper:]     大写字母字符   

[:digit:]     数字   

[:alnum:]     字母数字字符   

[:space:]     空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符[:punct:]     标点字符   

[:cntrl:]     控制字符(禁止打印)   

[:print:]     可打印字符 | 分隔替换选项,通常与分组操作符 () 一起使用   

( )           将子表达式分组为一个替换单元、量词单元或后向引用单元   

[char]        字符列表  

Oracle 10g提供了四个regexp function: REGEXP_LIKE , REGEXP_REPLACE , REGEXP_INSTR , REGEXP_SUBSTR

REGEXP_LIKE:比较一个字符串是否与正则表达式匹配   

(srcstr, pattern [, match_option])   

  

REGEXP_INSTR:在字符串中查找正则表达式,并且返回匹配的位置   

(srcstr, pattern [, position [, occurrence [, return_option [, match_option]]]])   

  

REGEXP_SUBSTR:返回与正则表达式匹配的子字符串   

(srcstr, pattern [, position [, occurrence [, match_option]]])   

  

REGEXP_REPLACE:搜索并且替换匹配的正则表达式   

(srcstr, pattern [, replacestr [, position [, occurrence [, match_option]]]])  

REGEXP_LIKE:比较一个字符串是否与正则表达式匹配

(srcstr, pattern [, match_option])

 

REGEXP_INSTR:在字符串中查找正则表达式,并且返回匹配的位置

(srcstr, pattern [, position [, occurrence [, return_option [, match_option]]]])

 

REGEXP_SUBSTR:返回与正则表达式匹配的子字符串

(srcstr, pattern [, position [, occurrence [, match_option]]])

 

REGEXP_REPLACE:搜索并且替换匹配的正则表达式

(srcstr, pattern [, replacestr [, position [, occurrence [, match_option]]]])其中各参数的含义为:

srcstr:         被查找的字符数据。   

pattern:        正则表达式。   

occurrence:     出现的次数。默认为1   

position:       开始位置   

return_option: 默认值为0,返回该模式的起始位置;值为1则返回符合匹配条件的下一个字符的起始位置。   

replacestr:     用来替换匹配模式的字符串。   

match_option:   匹配方式选项。缺省为c   

                ccase sensitive   

                Icase insensitive  

                n(.)匹配任何字符(包括newline)   

                m:字符串存在换行的时候被作为多行处理  

srcstr:        被查找的字符数据。

pattern:       正则表达式。

occurrence:    出现的次数。默认为1

position:      开始位置

return_option: 默认值为0,返回该模式的起始位置;值为1则返回符合匹配条件的下一个字符的起始位置。

replacestr:    用来替换匹配模式的字符串。

match_option:  匹配方式选项。缺省为c

               ccase sensitive

               Icase insensitive

               n(.)匹配任何字符(包括newline)

               m:字符串存在换行的时候被作为多行处理下面通过一些具体的例子来说明如何使用这四个函数。首先创建一个测试数据表,

/* Formatted on 3/22/2012 2:42:16 PM (QP5 v5.149.1003.31008) */

CREATE TABLE person

(

   first_name   VARCHAR (20),

   last_name    VARCHAR (20),

   email        VARCHAR (100),

   zip          VARCHAR (6)

);

 

INSERT INTO person

     VALUES ('Steven',

             'Chen',

             'steven@hp.com',

             '123456');

 

INSERT INTO person

     VALUES ('James',

             'Li',

             'jamesli@sun.com' || CHR (10) || 'lijames@oracle.com',

             '1b3d5f');

 

SELECT * FROM person;

 

 

1REGEXP_LIKE

select zip as invalid_zip from person where regexp_like(zip, '[^[:digit:]]');

 select first_name from person where regexp_like(first_name, '^S.*n$');

 select first_name from person where regexp_like(first_name, '^s.*n$');

 select first_name from person where regexp_like(first_name, '^s.*n$', 'c');    

 select first_name from person where regexp_like(first_name, '^s.*n$', 'i');

 select email from person where regexp_like(email, '^james.*com$'); 

 select email from person where regexp_like(email, '^james.*com$', 'n');

 select email from person where regexp_like(email, '^li.*com$');   

 select email from person where regexp_like(email, '^li.*com$', 'm');

 

注意上面分别测试了不同的match_option对结果的影响

2REGEXP_INSTR

--查找zip中第一个非数字字符的位置 

 select zip, regexp_instr(zip, '[^[:digit:]]'),as position from person;

--从第三个字符开始,查找zip中第二个非数字字符的位置

select zip,regexp_instr(zip, '[^[:digit:]]', 3, 2) as position from person;

--从第三个字符开始,查找zip中第二个非数字字符的下一个字符位置   

select zip,regexp_instr(zip, '[^[:digit:]]', 3, 2, 1) as position from person;

 

3REGEXP_SUBSTR

select zip, regexp_substr(zip, '[^[:digit:]]') as zip from person;   

select zip,regexp_substr(zip, '[^[:digit:]]', 3, 2) as zip from person

 

4REGEXP_REPLACE

update person set zip=regexp_replace(zip, '[^[:digit:]]', '0')   where regexp_like(zip, '[^[:digit:]]');

select * from person;

 

后向引用是一个很有用的特性。它能够把子表达式的匹配部分保存在临时缓冲区中,供以后重用。缓冲区从左至右进行编号,并利用 \digit 符号进行访问。子表达式用一组圆括号来显示。利用后向引用可以实现较复杂的替换功能。

selectregexp_replace('Steven Chen','(.*) (.*)','\2, \1')as reversed_name from dual;

 

DDL中也可以正则表达式,比如Constraint, index, view

 alter table person add constraint constraint_zip check (regexp_like(zip, '^[[:digit:]]+$'));    
 create index person_idx on person(regexp_substr(last_name, '^[[:upper:]]'));  

相关文章推荐

正则表达式在oracle中的应用

  • 2012年03月02日 15:50
  • 322KB
  • 下载

oracle正则表达式函数 匹配

文章介绍了关于oracle正则函数的一些用法,包括匹配等,Oracle10g提供了在查询中使用正则表达的功能,它是通过各种支持正则表达式的函数在where子句中实现的。 ORACLE中的...
  • cuker919
  • cuker919
  • 2013年11月20日 11:09
  • 11652

Oracle 10g正则表达式函数

  • 2008年09月17日 15:34
  • 56KB
  • 下载

oracle正则表达式

  • 2015年12月03日 14:13
  • 191KB
  • 下载

Oracle正则表达式实战

原文链接:http://oracle-base.com/articles/misc/regular-expressions-support-in-oracle.php Introduction   ...

oracle 正则表达式

  • 2013年11月14日 15:38
  • 14KB
  • 下载

Oracle 10g正则表达式

  • 2014年01月13日 16:31
  • 24KB
  • 下载

关于ORACLE正则表达式一些

那个Oracle的正则表达式4个函数看起来简单用起来麻烦,记起来繁琐! 一般很讨厌开源的东西搞个参数那么复杂,那么难用,要注意太多细节了。ORACLE中的支持正则表达式的函数主要有下面四个:1,REG...

Oracle正则表达式函数全面解析

  • 2017年04月11日 14:38
  • 424KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Oracle 正则表达式
举报原因:
原因补充:

(最多只允许输入30个字)