达梦数据库(oracle)使用 REGEXP_SUBSTR函数实现根据逗号将一行数据拆分成多行数据

首先简单介绍下 REGEXP_SUBSTR函数,函数格式如下:
function REGEXP_SUBSTR(String, pattern, position, occurrence, modifier)
__srcstr :需要进行正则处理的字符串

__pattern :进行匹配的正则表达式

__position :起始位置,从第几个字符开始正则表达式匹配(默认为1)

__occurrence :标识第几个匹配组,默认为1

__modifier :模式('i’不区分大小写进行检索;‘c’区分大小写进行检索。默认为’c’。可以省略)
另一般REGEXP_SUBSTR函数都会与CONNECT BY配合使用

业务场景

现有新闻图片库NEWS_TYPE表,字段如下
在这里插入图片描述
如图所示,每一条数据都对应着一个或多个ATTACH_ID,这样如果我们想要与ATTACH表进行联合查询就会很麻烦,使用REGEXP_SUBSTR能够解决这个问题.

SELECT DISTINCT 
ID, REGEXP_SUBSTR(ATTACH_ID, '[^,]+', 1, LEVEL) AS FILE_ONE
FROM NEWS_TYPE
CONNECT BY LEVEL <= LENGTH(ATTACH_ID) - LENGTH(regexp_replace(ATTACH_ID, ',', '')) + 1 
ORDER BY ID

查询结果如下:
在这里插入图片描述


好了下面问题来了,如果数据量小的话,这样来操作是没问题的,一旦数据量上来了,并且再加上多表联查,查询的速度就会非常慢(非常非常慢!),所以就有了下面的内容,优化.
经过多方查询资料,新的sql查询速度确实快到飞起,但实现原理一直都不清楚,等我查到以后再更新,先上新sql

SELECT ID, 
REGEXP_SUBSTR(ATTACH_ID, '[^,]+', 1, l) AS FILE_ONE
FROM NEWS_TYPE,(SELECT LEVEL l FROM DUAL CONNECT BY LEVEL<=100) b
WHERE l <= LENGTH(ATTACH_ID) - LENGTH(regexp_replace(ATTACH_ID, ',', '')) + 1
  • 19
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值