POSTFRESQL系列：SQL中使用正则校验处理

云舒卷云

于 2024-08-19 14:45:30 发布

阅读量379

点赞数 5

分类专栏： POSTGRESQL 文章标签： sql 数据库 postgresql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43216714/article/details/141324795

版权

POSTGRESQL 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

这里写自定义目录标题

需求描述
SQL部分
SQL部分解释
SQL部分大量执行的效率如何？
优化方向

需求描述

需要处理数据库表中某一个字段对应的数据，存储的时候是字符类型，插入数据逻辑中没有做较强的限制，导致后期业务需求中需要获取统一数据处理的时候的产生了不必要的问题。
以上是使用sql级别解决

SQL部分

COALESCE(NULLIF(REGEXP_REPLACE(dataTable.ziduan, '[^0-9]', '', 'g'), ''), '0')::NUMERIC < 80

SQL部分解释

这个函数使用正则表达式 [ ^0-9] 匹配非数字字符，将它们替换为空字符串。
```
REGEXP_REPLACE(dataTable.ziduan, '[^0-9]', '', 'g'):
```
如果 dataTable.ziduan 列中全是非数字字符，替换后的结果将是空字符串。通过 NULLIF 将空字符串转换为 NULL。
```
    NULLIF(REGEXP_REPLACE(...), ''):
```
使用 COALESCE 来处理 NULL 值，如果 NULLIF 返回 NULL，则使用默认值 ‘0’。
```
  COALESCE(NULLIF(...), '0'):
```
将最终结果转换为 NUMERIC 类型，以便可以进行数值比较。
```
    ::NUMERIC:
```
< 80这部分是将数值与 80 进行比较。

SQL部分大量执行的效率如何？

REGEXP_REPLACE 函数:

正则表达式的处理通常比直接字符串操作要慢，尤其是当需要遍历和替换整个字符串时。因此，这一步是最消耗性能的部分。如果你的数据集非常大，REGEXP_REPLACE 可能成为瓶颈。
NULLIF 和 COALESCE 函数:

这两个函数的执行开销相对较小。NULLIF 只是简单地比较两个值，COALESCE 也只是在一组值中找到第一个非空值，这两者的性能通常都不会成为瓶颈。
数据类型转换 (::NUMERIC):

数据类型的转换（特别是字符串到数值的转换）可能会消耗一定的资源，特别是在大量数据的情况下。虽然这一步通常不会成为主要的性能瓶颈，但它仍然对整体性能有影响。

优化方向

尽量减少正则表达式的使用:

如果你可以确保 dataTable.ziduan 列中的数据大部分是有效的数字，并且只在极少数情况下出现非数字字符，你可以考虑预先清洗数据，避免在查询时使用正则表达式。
数据库列类型的优化:

如果可能，将dataTable.ziduan 列的类型直接存储为 NUMERIC 或者 INTEGER 而不是字符串，这样可以完全避免后续查询中的类型转换和正则表达式处理，提高查询性能。
索引优化:

如果这个查询非常频繁，可以考虑在相关列上创建索引。不过，需要注意的是，这种情况下使用 REGEXP_REPLACE 可能无法有效利用索引。
缓存查询结果:

如果你的查询经常涉及到相同的计算，可以考虑使用缓存来保存处理后的结果，避免每次查询时都进行重复计算。

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

云舒卷云 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。