Oracle 正则文本中有第一组表达式从第一组开始截取，否则从第二组开始截取

最新推荐文章于 2023-09-03 08:04:51 发布

spark_Streaming

最新推荐文章于 2023-09-03 08:04:51 发布

阅读量365

点赞数

分类专栏： Oracle 文章标签： oracle 正则表达式

本文链接：https://blog.csdn.net/spark_Streaming/article/details/107577688

版权

Oracle 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在工作中遇到这样一个问题：

从大段文本中利用正则表达式截取：如果有第一组表达式则从第一组表达式开始截取，如果没有，从第二组表达式开始

例如：

SELECT * FROM 
(SELECT '该患者进行了EGFR中的20#外显子检测' diag_desc FROM dual 
UNION ALL
SELECT '患者进行了20#检测' FROM dual)

对于第一条数据：需要从此文本中截取EGFR开始到20#结束

对于第二条数据：需要从此文本中截取20#

两个正则表达式或者的关系可以满足，

eg：

SELECT 
diag_desc,
regexp_substr(diag_desc,'EGFR.*?20#|20#') reg_sub 
FROM 
(SELECT '该患者进行了EGFR 20#外显子检测' diag_desc FROM dual 
UNION ALL
SELECT '患者进行了20#检测' FROM dual)

可以满足，但用了或者关系，两个正则拼接，在大数据量的情况下，效率较低。后咨询同事得知还有另一种写法：

SELECT 
diag_desc,
regexp_substr(diag_desc,'(EGFR.*)?20#') reg_sub 
FROM 
(SELECT '该患者进行了EGFR 20#外显子检测' diag_desc FROM dual 
UNION ALL
SELECT '患者进行了20#检测' FROM dual)

思想：利用EGFR.*为一组为A组，利用?匹配0次或一次，1次的话肯定包含A组，0次的话不包含A组直接从20#开始截取

spark_Streaming

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Oracle 正则文本中有第一组表达式从第一组开始截取，否则从第二组开始截取

在工作中遇到这样一个问题：从大段文本中利用正则表达式截取：如果有第一组表达式则从第一组表达式开始截取，如果没有，从第二组表达式开始例如：SELECT * FROM (SELECT '该患者进行了EGFR中的20#外显子检测' diag_desc FROM dual UNION ALLSELECT '患者进行了20#检测' FROM dual)对于第一条数据：需要从此文本中截取EGFR开始到20#结束对于第二条数据：需要从此文本中截取20#两个正则表达式或者的关系可以满足..
复制链接

扫一扫