博学谷提供技术支持
正则表达式简介
正则表达式是描述搜索模式的特殊字符串。它是一个强大的工具,提供了一种基于模式识别文本字符串(例如字符和单词)的简洁灵活的方法。
例如,可以使用正则表达式来搜索电子邮件、IP 地址、电话号码、社保号或任何具有特定模式的内容。
正则表达式使用它自己的语法,可以由正则表达式处理器解释。正则表达式广泛用于从编程语言到包括 MySQL 在内的数据库的几乎所有平台。
使用正则表达式的好处是,不限于搜索基于固定模式的字符串,LIKE
运算符中带有百分号 (%) 和下划线 (_)。正则表达式有更多的元字符来构建灵活的模式。
使用正则表达式的缺点是很难理解和维护这样一个复杂的模式。因此,应该在 SQL 语句的注释中描述正则表达式的含义。此外,在某些情况下,如果在正则表达式中使用复杂的模式,数据检索的速度会降低。
正则表达式的缩写是regex或regexp。
MySQL REGEXP 运算符
MySQL 采用了Henry Spencer实现的正则表达式。MySQL 允许使用REGEXP
运算符在 SQL 语句中匹配模式。
下面说明了REGEXP
WHERE
子句中运算符 的语法:
SELECT column_list FROM table_name WHERE string_column REGEXP pattern;
如果 string_column
中的值匹配上了pattern
,则子句中的表达式WHERE
返回 true,否则返回 false。
除了REGEXP
运算符之外,还可以使用RLIKE
运算符。
MySQL 正则表达式示例
假设要查找姓氏以字符 A、B 或 C 开头的所有产品。可以在以下SELECT
语句中使用正则表达式:
SELECT productname FROM products WHERE productname REGEXP '^(A|B|C)' ORDER BY productname;
如果希望REGEXP
运算符以区分大小写的方式比较字符串,可以使用BINARY 运算符将字符串强制转换为二进制字符串。
例如,以下语句仅匹配"C"
产品名称开头的大写字母。
SELECT productname FROM products WHERE productname REGEXP BINARY '^C';