MySQL 正则表达式
MySQL仅支持多数正则表达式实现的一个很小的子集
-
基本字符匹配
关键词 REGEXP 用于表明该关键字后面的字符串为 正则表达式。
. 是正则表达式语言中的一个特殊字符,表示匹配任意一个字符。
默认情况下,正则表达式的匹配不区分大小写。为区分大小写,可以使用 BINARY关键字 。
-
进行OR匹配
| 是正则表达式中的 OR 操作符,表示匹配其中之一。
-
匹配几个字符之一
若只想匹配特定字符,可以通过 [ 和 ] 括起来,从而达到目的。
输入:SELECT 列名 FROM 表名 WHERE 列名 REGEXP ‘[123]abc’;
分析:[123] 定义一组字符,表示匹配 1 或 2 或 3。[ ] 是另一种形式的 OR 语句 ,[ 123 ] 其实为[ 1|2|3 ] 的缩写。
字符集也可以被否定,[^123]表示匹配除了123之外的任何字符。
-
匹配范围
集合可以用来定义要匹配的一个或者多个字符,如集合 [0123456789] ,该集合可以通过 - ,简化为 [0-9] 。 范围不限于完整的集合。[1-4]、[5-9] 均可以。也不仅限于数值,如 [a-z] 匹配任意字母字符。
-
匹配特殊字符
为了匹配特殊字符,必须用 \\ 为前导。 \\- 表示查找 - ,\\. 表示查找 .
这种处理成为 转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。包括 . 、| 、[ ] 等。为了匹配 反斜杠( \ ) 字符本身,需要使用 \\\
多数正则表达式实现使用单个反斜杠转义特殊字符,以便能使用这些字符本身。但MySQL要求使用两个反斜杠(MySQL自己解释一个,正则表达式库解释另一个)。
-
匹配字符类
为方便工作,可以使用预定义的字符集,称为字符类类 说明 [:alnum:] 任意字母和数字(同 [a-zA-Z0-9] ) [:digit:] 任意数字(同 [0-9] ) [:lower:] 任意小写字母(同 [a-z] ) [:upper:] 任意大写字母(同 [A-Z] ) [:alpha:] 任意字符(同 [a-zA-Z] ) [:cntrl:] ASCII 控制符( ASCII 0到31和127 ) [:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 的字符 [:print:] 任意可打印字符 [:graph:] 与 [:print:] 相同,但不包括空格 [:blank:] 空格和制表(同 [\\t] ) [:space:] 包括空格在内的任意空白字符 (同 \\f\\n\\r\\t\\v) [:xdigit:] 任意十六进制数字(同 [a-fA-F0-9] ) -
匹配多个实例
可以利用正则表达式的重复元字符来匹配多个实例元字符 说明 * 0个或多个匹配 + 1个或多个匹配(等价于 {1, } ) ? 0个或1个匹配(等价于 {0, 1} ) {n} 指定数目的匹配 {n, } 不少于指定数目的匹配 {n,m} 匹配数目的范围(m不超过255) 输入1:SELECT 列名 FROM 表名 WHERE 列名 REGEXP ‘\\([0-9] abcs?\\)’;
分析: \\( : 匹配 ( , [0-9] 匹配任意数字 ,abcs? 匹配 abc 和abcs (s后的? 使 s 可选,匹配 ? 前面的任意字符), \\) : 匹配 ) 。输入2:SELECT 列名 FROM 表名 WHERE 列名 REGEXP ‘[[:digit:]]{4}’;
分析: 匹配连在一起的任意4位数字。 -
定位符
为了匹配特定位置的文本,可以使用定位符元字符 说明 ^ 文本的开始 $ 文本的结尾 [[:<:]] 词的开始 [[:>:]] 词的结尾 输入:SELECT 列名 FROM 表名 WHERE 列名 REGEXP ‘^[0-9\\.]’;
分析: 匹配以 0, 1, … ,9 和 . 为起始位置的串。注意: 1、 ^ 有两种用法,在集合(用 [和] 定义)中用来否定该集合,否则,用来指定匹配串的开始处。 2、 LIKE 和 REGEXP 的不同点在于,LIKE匹配整个穿而 REGEXP匹配子串。利用定位符,通过用 ^ 指定每个表达式的开始位置,用 $ 指定每个表达式的结束位置,可以使 REGEXP 的作用与 LIKE 一致。