学习如何在where子句中使用正则表达式更好的控制数据过滤
正则匹配不区分大小写,若需要区分大小写:regexp binary
- 基本字符匹配
# 1
#检索prod_name包含文本1000的所有行
select prod_name
from products
where prod_name regexp '1000'
order by prod_name;
# 2
select prod_name
from products
where prod_name regexp '.000'
order by prod_name;
# .在正则表达式中表示匹配任意一个字符
- 进行or匹配
#检索两个串之一
select prod_name
from products
where prod_name regexp '1000|2000'
order by prod_name;
#可以给出两个以上的or条件,'1000|2000|3000'
- 匹配几个字符之一
匹配任何单一字符
select prod_name
from products
where prod_name regexp '[123] Ton'
order by prod_name;
#[123]定义一组字符,意为匹配1或2或3
#注意⚠️:除非将|括在一个集合,否则将会应用于整个串。例如:1|2|3 ton会被MySQL理解为“1或2或3 ton”
#若想否定一组字符,只需:[^123]即可
- 匹配范围
[0123456789]匹配0-9的10个数字,为简化,也可:[0-9]
当然字母也可以[a-z][d-k]
select prod_name
from products
where prod_name regexp '[1-5] ton'
order by prod_name;
- 匹配特殊字符
已经知道 .、[]、|、-等字符是具有特定含义的,那如何匹配这些特殊字符?
必须使用\作为前导,即转义(escaping)
select vend_name
from vendors
where vend_name regexp '\.'
order by vend_name;
同时,\也用来引用元字符(具有特殊含义的字符)
元字符 | 说明 |
---|---|
\f | 换页 |
\n | 换行 |
\r | 回车 |
\t | 制表 |
\v | 纵向制表 |
- 匹配字符类
为了方便工作,可以使用预定义的字符集,称为字符类(character class)
类 | 说明 |
---|---|
[:alnum:] | 任意字母和数字(同[a-z][0-9]) |
[:alpha:] | 任意字符 |
[:blank:] | 空格和制表(同[\t]) |
[:cntrl:] | ASCII控制字符(ASCII 0到31和127) |
[:digit:] | 任意数字 |
[:graph:] | 与[:print:]相同,但不包括空格 |
[:lower:] | 任意小写字母 |
[:print:] | 任意可打印字符 |
[:punct:] | 既不在[:alnum:]又不在[:ctrl:]中的任意字符 |
[:space:] | 包括空格在内的任意空白字符 |
[:upper:] | 任意大写字母 |
[:xdigit:] | 任意十六进制数字 |
- 匹配多个实例
元字符 | 说明 |
---|---|
* | 0个或多个匹配 |
+ | 1个或多个匹配 |
? | 0个或1个匹配 |
{n} | 指定数目的匹配 |
{n,} | 不少于指定数目的匹配 |
{n,m} | 匹配数目的范围(m不超过255) |
# 1
select prod_name
from products
where prod_name regexp '\([0-9] sticks?\)'
order by prod_name;
# \(匹配(
#[0-9]匹配任意数字
#sticks匹配stick和sticks
#\)匹配)
#注意⚠️:s后面的?代表它前面的任何字符的0次或1次出现
# 2 匹配连在一起的4位数字
select prod_name
from products
where prod_name regexp '[[:digit:]]{4}'
order by prod_name;
#{4}表示要求它前面的字符(任意数字)出现4次
#也可以写为'[0-9][0-9][0-9][0-9]'
- 定位符
元字符 | 说明 |
---|---|
^ | 文本的开始 |
$ | 文本的结尾 |
[[:<:]] | 词的开始 |
[[:>:]] | 词的结尾 |
# 找出一个数(包含.)开始的所有产品
select prod_name
from products
where prod_name regexp '^[0-9\.]'
order by prod_name;
- 简单的正则表达式测试
可以在不使用数据库表的情况下利用select语句进行测试正则表达式
返回0说明不匹配,返回1说明匹配
select 'hello' regexp '[0-9]';
#返回0,说明不匹配