1、正则表达式
我们在进行字符串比对和处理的时候;可能用得最多是like子句;其中%代表一个到多个字符;_代表一个字符。但是处理比较复杂字符串时;发现这远远达不到我们所需的要求。所以这种低端,不美观的语句。当然我们也不抛弃它们;毕竟oracle都没放弃他们。在Oracle10g后,提供了若干与正则表达式相关的函数和操作。用好这些函数,可以大大提升我们的处理字符串的能力和水平。
先看下这个表;一切变换都在此表;这表就是正则的心法。
元字符 | 意思 | 例子 |
\ | 说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配) |
\n 匹配换行符 \\ 匹配 \ \( 匹配 ( \) 匹配 ) |
^ | 匹配字符串的开头位置 | ^a匹配arwen.但不匹配barwen. |
$ | 匹配字符串的末尾位置 | en$匹配arwen.但不匹配arwenb. |
* | 匹配前面的字符0次或多次 | a*rwen可以匹配rwen或aaarwen. |
+ | 匹配前面的字符1次或多次 | a+rwen可以匹配arwen或aarwen.但不能匹配rwen. |
? | 匹配前面的字符0次或1次 | a?rwen可以匹配arwen或rwen.但不能匹配aarwen. |
{n} | 匹配前面的字符恰好是n次,其中n是整数 | ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen. |
{n,m} | 匹配前面的字符至少是n次,最多是m次.如果写成 {n,}表示最少匹配n次.没有上限. |
ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen. |
. | 点号,匹配除null,换行以外的任意单个字符 | arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn. |
(pattern) | 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 | 其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于\n的描述. |
x|y | 匹配“或” | x|y可以匹配x或者y |
[abc] | 可以匹配abc中的任何单个字符 | hello[abc]可以匹配helloa,hellob,helloc |
[a-z] | 可以匹配指定范围内的任何单个字符 | hell[a-z]可以匹配hello或者hellz |
[::] | 指定一个字符类,可以匹配该类中的任何字符 | [:alphanum:]可以匹配字符0-9、A-Z、a-z [:alpha:]可以匹配字符A-Z、a-z [:blank:]可以匹配空格或tab键 [:digit:]可以匹配数字0-9 [:graph:]可以匹配非空字符 [:lower:]可以匹配小写字母a-z [:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符 [:punct:]可以匹配标点符号.,""等等 [:space:]可以匹配所有的空字符 [:upper:]可以匹配大写字母A-Z [:xdigit:]可以匹配十六进制数字0-9、A-F、a-f |
\n | 这是对前一次匹配命中的一个后引用,其中n是一个正整数 | arw(en)\1可以匹配arwenen.注意\1前面必须是个加括号的子表达式. |
先提供一个事例表regexp_li0924来供我们练习:
1 2 3 4 5 6 7 8 9 10 11 |
|