mysql+正则清理字符串_MySQL 正则表达式匹配文本字符串的使用

正则表达式作用是匹配文本,将一个模式(正则表达式)与一个文本字符串进行比较。

MySQL用WHERE子句对正则表达式提供了初步的支持,允许用正则表达式过滤SELECT检索出的数据。

MySQL仅支持多数正则表达式实现的一个很小的子集。

9.2.1  基本字符匹配

REGEXP后所跟的东西作为正则表达式处理。

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘1000’

ORDER BY prod_name;返回:

+————————+

| prod_name |

+————————+

| JetPack 1000 |

+————————+

.  表示匹配任意一个字符。

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘.000’

ORDER BY prod_name;返回:+————————-+

| prod_name |

+————————-+

| JetPack 1000 |

| JetPack 2000 |

+————————-+

MySQL中的正则表达式匹配不区分大小写。

为区分大小写,可使用BINARY关键字。

如:WHERE prod_name REGEXP BINARY ‘JetPack .000’

9.2.2  进行OR匹配

为搜索两个串之一(或者这个串,或者为另一个串),使用 | 。

| 作为OR操作符,表示匹配其中之一。可给出两个以上的OR条件。

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘1000 | 2000’

ORDER BY prod_name;返回:+———————-+

| prod_name |

+———————-+

| JetPack 1000 |

| JetPack 2000 |

+———————-+

[ ] 匹配任何单一字符。

[123]定义一组字符,意思是匹配1或2或3.

[ ]是另外一种形式的OR语句,[123] Ton  就是  [1 | 2 | 3] Ton 的缩写。

^ 否定一个字符集合,将匹配除指定字符外的任何东西。[^123]将匹配除这些字符外的任何东西。

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘[123] Ton’

ORDER BY prod_name;返回:+——————–+

| prod_name |

+——————–+

| 1 ton anvil |

| 2 ton anvil |

+——————–+

匹配范围

[0123456789] 或 [0-9] 将匹配数字0到9

[a-z] 匹配任意字母符号

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘[1-5] Ton’

ORDER BY prod_name;返回:+——————-+

| prod_name |

+——————-+

| .5 ton anvil |

| 1 ton anvil |

| 2 ton anvil |

+——————-+

匹配特殊字符

\\  为前导。即转义.正则表达式内具有特殊意义的所有字符都必须以这种方式转义。

\\-  表示查找 –

\\.  表示查找 .

SELECT prod_name

FROM vendors

WHERE vend_name REGEXP ‘\\.’

ORDER BY vend_name;返回:+———————-+

| vend_name |

+———————-+

| Furball Inc. |

+———————-+

\\  也用来引用元字符(具有特殊意义的字符)

\\f 换页

\\n 换行

\\r 回车

\\t 制表

\\v 纵向制表

匹配字符类

[:a;num:] 任意字母和数字(同 [a-zA-Z0-9])

[:alpha:] 任意字符(同 [a-zA-Z])

[:blank:] 空格和制表(同 [\\t])

[:cntrl:] ASCII控制字符(ASCII 0到31和127)

[:digit:] 任意数字(同[0-9])

[:graph:] 与[“print:] 相同,但不包括空格

[:lower:] 任意小写字线(同 [a-z])

[:print:] 任意可打印字符

[:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符

[space:] 包括空格在内的任意空白字符(同 [\\f\\n\\t\\r\\v])

[:upper:] 任意大小字母(同 [A-Z])

[:xdigit:] 任意十六进制数字(同 [a-fA-F0-9])

匹配多个实例

元字符 说明

* 0个或多个匹配

+ 1个或多个匹配(等于 {1, })

? 0个或1个匹配(等于 {0, 1})

{n} 指定数目的匹配

{n, } 不少于指定数目的匹配

{n ,m} 匹配数目的范围(m不超过255)

以下例子:s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现。

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘\\([0-9] sticks?\\)’

ORDER BY prod_name;返回:+———————–+

| prod_name |

+———————–+

| TNT (1 stick) |

| TNT (5 sticks) |

+———————–+

匹配连在一直的4位数字:WHERE prod_name REGEXP ‘[[:digit:]]{4}’

定位符

^ 文本的开始

$ 文本的末尾

[[:<:>

[[:>:]] 词的结尾

SELECT prod_name

FROM products

WHERE prod_name REGEXP ‘^[0-9\\.]’

ORDER BY prod_name;返回:+———————+

| prod_name |

+———————+

| .5 ton anvil |

| 1 ton anvil |

| 2 ton anvil |

+———————+

^的双重用途:在集合中(用[ ]定义),用它来否定该集合。否则,用来指串的开始和。

LIKE 匹配整个串,而REGEXP匹配子串。

简单的正则表达式测试  可以在不使用数据库的情况下用SELECT来测试正则表达式。

REGEXP检查总是返回0(没有匹配)或1(匹配),可以用带文字串的REGEXP来测

试表达式,并试验它们。相应的语法如下:

SELECT ‘hello’ REGEXP ‘[0-9]’

这个例子返回0(因为文本hello中没有数字)。

CodeBye 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权 , 转载请注明MySQL 正则表达式匹配文本字符串的使用!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值