1.题目信息
患者信息表: Patients
±-------------±--------+
| Column Name | Type |
±-------------±--------+
| patient_id | int |
| patient_name | varchar |
| conditions | varchar |
±-------------±--------+
patient_id (患者 ID)是该表的主键。
‘conditions’ (疾病)包含 0 个或以上的疾病代码,以空格分隔。
这个表包含医院中患者的信息。
写一条 SQL 语句,查询患有 I 类糖尿病的患者 ID (patient_id)、患者姓名(patient_name)以及其患有的所有疾病代码(conditions)。I 类糖尿病的代码总是包含前缀 DIAB1 。
按 任意顺序 返回结果表。
查询结果格式如下示例所示。
示例 1:
输入:
Patients表:
±-----------±-------------±-------------+
| patient_id | patient_name | conditions |
±-----------±-------------±-------------+
| 1 | Daniel | YFEV COUGH |
| 2 | Alice | |
| 3 | Bob | DIAB100 MYOP |
| 4 | George | ACNE DIAB100 |
| 5 | Alain | DIAB201 |
±-----------±-------------±-------------+
输出:
±-----------±-------------±-------------+
| patient_id | patient_name | conditions |
±-----------±-------------±-------------+
| 3 | Bob | DIAB100 MYOP |
| 4 | George | ACNE DIAB100 |
±-----------±-------------±-------------+
解释:Bob 和 George 都患有代码以 DIAB1 开头的疾病。
2.解题思路
改题主要是使用了正则表达式。分析使用like或者rlike或者regexp
3.知识点
3.1.like模糊匹配-单项
常用通配符有两个: ‘%‘百分号、’_‘下划线。
%: 可以匹配0~多个字符
_: 只能匹配1个字符,即’_A’,在’1A’、‘1AB’列表里,仅返回’1A’
3.2 rlike和regexp
搭配正则表达式,rlike与REGEXP用法相似。
- 1.多个常规字符串的模糊匹配:
说明: “|”,就是or或者的符号
rlike ‘A|B’
等同于
like ‘%A%’ or like ‘%B%’ - 2.包含特殊字符的模糊匹配:
说明: "()“括号将作为正则符号识别,需进行转义。”、"顿号无需转义,其余的符号自行扩展。
rlike ‘A\(2\)|B2’,即使用’\'双斜线对特殊符号转义
等同于
like ‘%A(2)%’ or like ‘%B2%’
4.正则表达式
4.1.实例
了解以上的正则需求后,我们就可以根据自己的需求来编写带有正则表达式的SQL语句。以下我们将列出几个小实例(表名:person_tbl )来加深我们的理解:
查找name字段中以’st’为开头的所有数据:
SELECT name FROM person_tbl WHERE name REGEXP '^st';
查找name字段中以’ok’为结尾的所有数据:
SELECT name FROM person_tbl WHERE name REGEXP 'ok$';
查找name字段中包含’mar’字符串的所有数据:
SELECT name FROM person_tbl WHERE name REGEXP 'mar';
查找name字段中以元音字符开头或以’ok’字符串结尾的所有数据:
SELECT name FROM person_tbl WHERE name REGEXP '^[aeiou]|ok$';
5.like,rlike,regexp三者之间的区别
- like的内容不是正则,而是通配符。像mysql中的"like",但是建议使用高级函数"instr"效率更高。
- rlike的内容可以是正则。
- regexp == rlike 同义词 not like not regexp
6.代码
# \s 代表空格
# 整体意思是匹配 以DIAB1开头的字符串 或者 空格前面有0个或多个字符并且中间包含DIAB1的字符串
select * from Patients where conditions REGEXP "^DIAB1|.*\\sDIAB1"
order by patient_id