正则表达式的规则

表 1:定位元字符
元字符 说明 
^ 使表达式定位至一行的开头 
$ 使表达式定位至一行的末尾 

表 2:量词或重复操作符 量词 说明 
* 匹配 0 次或更多次 
? 匹配 0 次或 1 次 
+ 匹配 1 次或更多次 
{m} 正好匹配 m 次 
{m,} 至少匹配 m 次 
{m, n} 至少匹配 m 次但不超过 n 次 


表 3:预定义的 POSIX 字符类 字符类 说明 
[:alpha:] 字母字符 
[:lower:] 小写字母字符 
[:upper:] 大写字母字符 
[:digit:] 数字 
[:alnum:] 字母数字字符 
[:space:] 空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符 
[:punct:] 标点字符 
[:cntrl:] 控制字符(禁止打印) 
[:print:] 可打印字符 


表 4:表达式的替换匹配和分组 元字符 说明 
| 替换 分隔替换选项,通常与分组操作符 () 一起使用 
( ) 分组 将子表达式分组为一个替换单元、
量词单元或后向引用单元(参见“后向引用”部分) 
[char] 字符列表 表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字 


表 5:REGEXP_LIKE 操作符 语法 说明 
REGEXP_LIKE(source_string, pattern
[, match_parameter]) source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。
pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。 


表 6:REGEXP_INSTR 函数 语法 说明 
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]]) 该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 
start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,
它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。 


表 7: 5 位数字加 4 位邮政编码表达式的说明 语法 说明 
 必须匹配的空白 
[:digit:] POSIX 数字类  
] 字符列表的结尾  
{5} 字符列表正好重复出现 5 次 
( 子表达式的开头  
- 一个文字连字符,因为它不是一个字符列表内的范围元字符 
[ 字符列表的开头  
[:digit:] POSIX [:digit:]类 
[ 字符列表的开头  
] 字符列表的结尾 
{4} 字符列表正好重复出现 4 次  
) 结束圆括号,结束子表达式  
? ? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选 
$ 定位元字符,指示行尾 


表 8:REGEXP_SUBSTR 函数 语法 说明 
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]]) REGEXP_SUBSTR 函数返回匹配模式的子字符串。 


表 9: REGEXP_REPLACE 函数 语法 说明 
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]]) 该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。 


表 10:后向引用元字符 元字符 说明 
\digit 反斜线 紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。 


表 11:模式交换正则表达式的说明 正则表达式项目 说明 
( 第一个子表达式的开头  
. 匹配除换行符之外的任意单字符 
* 重复操作符,匹配之前的 . 元字符 0 到 n 次 
) 第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。) 
 必须存在的空白  
( 第二个子表达式的开头  
. 匹配除换行符之外的任意单个字符  
* 重复操作符,匹配之前的 . 元字符 0 到 n 次 
) 第二个子表达式的结尾;匹配结果在 \2
中获取(在这个例子中,结果为 Hildi。) 
 空白  
( 第三个子表达式的开头  
. 匹配除换行符之外的任意单字符  
* 重复操作符,匹配之前的 . 元字符 0 到 n 次 
) 第三个子表达式的结尾;匹配结果在 \3
中获取(在这个例子中,结果为 Smith。) 


表 12:社会保险号码正则表达式的说明 正则表达式项目 说明 
^ 行首字符(正则表达式在匹配之前不能有任何前导字符。) 
( 开始子表达式并列出用 | 元字符分开的可替换选项 
[ 字符列表的开头 
[:digit:] POSIX 数字类  
] 字符列表的结尾  
{3} 字符列表正好重复出现 3 次  
- 连字符  
[ 字符列表的开头  
[:digit:] POSIX 数字类 
] 字符列表的结尾  
{2} 字符列表正好重复出现 2 次  
- 另一个连字符  
[ 字符列表的开头  
[:digit:] POSIX 数字类  
] 字符列表的结尾  
{4} 字符列表正好重复出现 4 次  
| 替换元字符;结束第一个选项并开始下一个替换表达式 
[ 字符列表的开头  
[:digit:] POSIX 数字类 
] 字符列表的结尾 
{9} 字符列表正好重复出现 9 次  
) 结束圆括号,结束用于替换的子表达式组 
$ 定位元字符,指示行尾;没有额外的字符能够符合模式 
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值