postgresql 数据库用正则提取非中文、非单词、非数字字符

最新推荐文章于 2024-06-19 17:47:44 发布

娟娟

最新推荐文章于 2024-06-19 17:47:44 发布

阅读量6.5k

点赞数 2

分类专栏： postgresql 文章标签： postgresql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39976528/article/details/116492491

版权

postgresql 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、在postgre数据库中通过正则将2千万数据中的字符给提取出来：

select * from 表名 where 字段名 ~'[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]|[\^A-Z]|[\^a-z]|[\^0-9]|[\^ａ-ｚ０-９Ａ-Ｚ]'

注释：

[\^ａ-ｚ０-９Ａ-Ｚ]： a-z：小写字母、0-9数字、A-Z大写字母 ^ 表示从开头开始匹配，\表示原义匹配

[\^A-Z]：表示匹配大写字母

[\^a-z]：表示匹配小写字母

[\^0-9]：表示匹配数字

[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]：表示匹配当前字段内容中的特殊符号，如：

上面的sql需要优化，如果数据量小，没问题，如果数据量大，跑起来特别的慢，需要稍微更改下sql:

select * from

(

select 表名1，表名2，表名3 ~'[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]|[\^A-Z]|[\^a-z]|[\^0-9]|[\^ａ-ｚ０-９Ａ-Ｚ]' as 虚拟列名4 from 表名

) as a where 虚拟列名4 ='f'

#sql注释：f意思是false的意思，虚拟列名4这一列表示的是bool类型，值为true和false，所以虚拟列名4可以等于‘f’或者是‘t’，意思是把虚拟列4这一列把值为false的都筛选出来。

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
postgresql 数据库用正则提取非中文、非单词、非数字字符

1、在postgre数据库中通过正则将2千万数据中的字符给提取出来：select * from 表名 where 字段名 ~'[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]|[\^A-Z]|[\^a-z]|[\^0-9]|[\^ａ-ｚ０-９Ａ-Ｚ]'注释：[\^ａ-ｚ０-９Ａ-Ｚ]： a-z：小写字母、0-9数字、A-Z大写字母 ^ 表示从开头开始匹配，\表示原义匹配[\^A-Z]：表示匹配大写字母[\^a-z]：表示匹配小...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。