oracle 正则表达式函数-REGEXP_SUBSTR
REGEXP_SUBSTR函数格式如下:
REGEXP_SUBSTR(String, pattern, position, occurrence, modifier)
5个参数
srcstr :需要进行正则处理的字符串
pattern :进行匹配的正则表达式
position :起始位置,从第几个字符开始正则表达式匹配(默认为1)
occurrence :标识第几个匹配组,默认为1
modifier :模式('i'不区分大小写进行检索;'c'区分大小写进行检索。默认为'c'; 'n':点号 . 不匹配换行符号;'m':多行模式;' x':扩展模式,忽略正则表达式中的空白字符。)例子:
- 1、为了便于操作,我们先建一张视图VV
- CREATE OR REPLACE VIEW VV AS SELECT 'TOM,JONES,KING' AS NAME FROM DUAL;
- 2、查询使用正则分割后的第1个值,也就是TOM
- SELECT REGEXP_SUBSTR(VV.NAME,'[^,]+',1,1,'i') AS STR FROM VV;
- 3、查询使用正则分割后的第2个值,也就是JONES
- SELECT REGEXP_SUBSTR(VV.NAME,'[^,]+',1,2,'i') AS STR FROM VV;
正则表达式 '[^,]+' 表示匹配不包括逗号的多个字符;
获取一个多个数值的列,从而能够让结果以多行的形式展示出来
SELECT NVL(REGEXP_SUBSTR(VV.NAME, '[^,]+', 1, LEVEL, 'i'), 'NULLL') AS STR FROM VV CONNECT BY LEVEL <= 3;
结果为:STR
TOM,
JONES,
KING
当然,大部分情况下我们截取出来的字符串个数是不确定的,上述中的3是不能写死的,那么我们就要想办法把截取的字符串个数计算出来;
我们可以看到,截取的字符串的个数就是原来的字符串中的逗号的个数加 1
原来字符串中逗号的个数等于字符串的总长度减去非逗号的个数
SELECT LENGTH(VV.NAME) - LENGTH(REGEXP_REPLACE(VV.NAME, ',', '')) + 1 FROM VV;
结果为3
SELECT REGEXP_SUBSTR(VV.NAME, '[^,]+', 1, LEVEL, 'i') AS STR
FROM VV
CONNECT BY LEVEL <= LENGTH(VV.NAME) -
LENGTH(REGEXP_REPLACE(VV.NAME, ',', '')) + 1;结果为:STR
TOM,
JONES,
KING