Oracle正则表达式(2)

ORACLE 终于在 10G中提供了对正则表达式的支持,以前那些需要通过 LIKE 来进行的复杂的匹配就可以通过使用正则表达式更简单的实现。

ORACLE 中的支持正则表达式的函数主要有下面四个:


1
REGEXP_LIKE :与 LIKE 的功能相似

2 REGEXP_INSTR :与 INSTR 的功能相似

3 REGEXP_SUBSTR :与 SUBSTR 的功能相似

4 REGEXP_REPLACE :与 REPLACE 的功能相似

在新的函数中使用正则表达式来代替通配符‘ % ’和‘ _ ’。

正则表达式由标准的元字符( metacharacters )所构成:

' ^ ' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。

' $ ' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 'n' 'r'

' . ' 匹配除换行符 n 之外的任何单字符。

' ? ' 匹配前面的子表达式零次或一次。

' + ' 匹配前面的子表达式一次或多次。

' * ' 匹配前面的子表达式零次或多次。

'|' 指明两项之间的一个选择。例子 '^([a-z]+|[0-9]+)$' 表示所有小写字母或数字组合成的字符串。

'( )' 标记一个子表达式的开始和结束位置。

'[]' 标记一个中括号表达式。

'{m,n}' 一个精确地出现次数范围, m=< 出现次数 <=n '{m}' 表示出现 m 次, '{m,}' 表示至少出现 m 次。

num 匹配 num ,其中 num 是一个正整数。对所获取的匹配的引用。

字符簇:

[[:alpha:]] 任何字母。

[[:digit:]] 任何数字。

[[:alnum:]] 任何字母和数字。

[[:space:]] 任何白字符。

[[:upper:]] 任何大写字母。

[[:lower:]] 任何小写字母。

[[:punct:]] 任何标点符号。

[[:xdigit:]] 任何 16 进制的数字,相当于 [0-9a-fA-F]

各种操作符的运算优先级

转义符

(), (?:), (?=), [] 圆括号和方括号

*, +, ?, {n}, {n,}, {n,m} 限定符

^, $, anymetacharacter 位置和顺序

| “ 操作

下面通过几个例子来具体说明这几个新函数的使用方法:

 

SQL> create table sunwg (id varchar2(100));

Table created.

SQL> insert into sunwg values ('<a href="http://sunwgneuqsoft.itpub.net/post/34741/447698"> 常见 SQL 访问索引的方式 </a>');

1 row created.

SQL> commit;

Commit complete.

SQL> select * from sunwg;

ID

----------------------------------------------------------------------------------------------------

<a href="http://sunwgneuqsoft.itpub.net/post/34741/447698"> 常见 SQL 访问索引的方式 </a>

1, REGEXP_LIKE

REGEXP_LIKE LIKE 类似,用 REGEXP_LIKE 能实现的操作大部分都可以用 LIKE 实现,不过要简单方便得多。

<a> 目标:查询表 sunwg 中是否存在类似与 3XX41 的记录?

LIKE

select * from sunwg where id like '%3__41%';

REGEXP_LIKE

select * from sunwg where regexp_like(id,'3..41');

<b> 目标:查询表 sunwg 中是否存在类似与 3XX41 的记录 , 并且 XX 必须是数字?

LIKE

这个 LIKE 我就想出来很好的实现办法了,唯一想到就是截取出来后判断该字符串是不是纯数字的。

REGEXP_LIKE

select * from sunwg where regexp_like(id,'3[0-9]{2}41');

REGEXP_LIKE 则可以简单快捷的得到结果。其他几个函数也都有类似的情况,下面的函数就不具体比较差异了,仅仅给出常用的用法。

2, REGEXP_INSTR

<a> 目标:查询表 sunwg 中是否存在类似与 3XX41 的字符串第一次出现的位置?

SQL> select regexp_instr(id,'3..41',1,1) from sunwg;

REGEXP_INSTR(ID,'3..41',1,1)

----------------------------

46

SQL> select substr(id,46,5) from sunwg;

SUBST

-----

34741

3, REGEXP_SUBSTR

<a> 目标:截取出表 sunwg 中的 URL 地址?

SQL> select regexp_substr(id,'http[0-9a-zA-Z/:.]+') from sunwg;

REGEXP_SUBSTR(ID,'HTTP[0-9A-ZA-Z/:.]+')

----------------------------------------------------------------------------------------------------

http://sunwgneuqsoft.itpub.net/post/34741/447698

4, REGEXP_REPLACE

<a> 目标:替换表 sunwg 中的 URL 的地址为 http://www.163.com/ ?

SQL> select regexp_replace(id,'http[0-9a-zA-Z/:.]+','www.163.com') from sunwg;

REGEXP_REPLACE(ID,'HTTP[0-9A-ZA-Z/:.]+','WWW.163.COM')

------------------------------------------------------------------------------------------------------------------------------------------------------

<a href="www.163.com"> 常见 SQL 访问索引的方式 </a>

 

从上面的例子可以看得出来这几个支持正则表达式的函数是十分强大的,合理的加以使用一定会使你写出的 SQL 更加简单高效。

最后,附加点sql中LIKE语句的见解:

LIKE
确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完 全匹配。然而,可使用字符串的任意片段匹配通配符。与使用 = 和 != 字符串比较运算符相比,使用通配符可使 LIKE 运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft&reg; SQL Server&#8482; 会将其转换成字符串数据类型(如果可能)。

语法
match_expression [ NOT ] LIKE pattern [ ESCAPE escape_character ]

参数
match_expression

任何字符串数据类型的有效 SQL Server 表达式。

pattern

match_expression 中的搜索模式,可以包含下列有效 SQL Server 通配符。

通配符 描述 示例
% 包含零个或更多字符的任意字符串。 WHERE title LIKE '%computer%' 将查找处于书名任意位置的包含单词 computer 的所有书名。
_(下划线) 任何单个字符。 WHERE au_fname LIKE '_ean' 将查找以 ean 结尾的所有 4 个字母的名字(Dean、Sean 等)。
[ ] 指定范围 ([a-f]) 或集合 ([abcdef]) 中的任何单个字符。 WHERE au_lname LIKE '[C-P]arsen' 将查找以arsen 结尾且以介于 C 与 P 之间的任何单个字符开始的作者姓氏,例如,Carsen、Larsen、Karsen 等。
[^] 不属于指定范围 ([a-f]) 或集合 ([abcdef]) 的任何单个字符。 WHERE au_lname LIKE 'de[^l]%' 将查找以 de 开始且其后的字母不为 l 的所有作者的姓氏。


escape_character

字符串数据类型分类中的所有数据类型的任何有效 SQL Server 表达式。escape_character 没有默认值,且必须仅包含一个字符。

结果类型
Boolean

结果值
如果 match_expression 匹配指定模式,LIKE 将返回 TRUE。

注释
当使用 LIKE 进行字符串比较时,模式字符串中的所有字符都有意义,包括起始或尾随空格。如果查询中的比较要返回包含"abc "(abc 后有一个空格)的所有行,则将不会返回包含"abc"(abc 后没有空格)的列所在行。但是可以忽略模式所要匹配的表达式中的尾随空格。如果查询中的比较要返回包含"abc"(abc 后没有空格)的所有行,则将返回以"abc"开始且具有零个或多个尾随空格的所有行。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值