CASE WHEN 及 SELECT CASE WHEN的用法
(1)Case具有两种格式。简单Case函数和Case搜索函数。
1)、简单Case函数
CASE sex
WHEN '1' THEN '男'
WHEN '2' THEN '女'
ELSE '其他' END
2)、Case搜索函数
CASE WHEN sex = '1' THEN '男'
WHEN sex = '2' THEN '女'
ELSE '其他' END
以上两种方式,可以实现相同的功能。简单Case函数的写法相对比较简洁,但是和Case搜索函数相比,功能方面会有些限制,比如写判断式。
3)、此外,还有一个需要注意的问题,Case函数只返回第一个符合条件的值,剩下的Case部分将会被自动忽略。
--比如说,下面这段SQL,你永远无法得到“第二类”这个结果
CASE WHEN col_1 IN ( 'a', 'b') THEN '第一类'
WHEN col_1 IN ('a') THEN '第二类'
ELSE'其他' END
(2)下面我们来看一下,使用Case函数都能做些什么事情。
一,已知数据按照另外一种方式进行分组,分析。
create table table_a(name varchar(10),sex int,population int );
insert into table_a(name,sex,population) values('cn',1,340);
insert into table_a(name,sex,population) values('cn',2,260);
insert into table_a(name,sex,population) values('us',1,45);
insert into table_a(name,sex,population) values('us',2,55);
insert into table_a(name,sex,population) values('canada',1,51);
insert into table_a(name,sex,population) values('canada',2,49);
insert into table_a(name,sex,population) values('uk',1,40);
insert into table_a(name,sex,population) values('uk',2,60);
insert into table_a(name,sex,population) values('other',33,45);
有如下数据
根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。
解决这个问题,你会怎么做?生成一个带有洲Code的View是一个解决方法,但是这样很难动态的改变统计的方式。如果使用Case函数,SQL代码如下:
SELECT SUM(population)
, CASE name
WHEN 'cn' THEN '亚洲'
WHEN 'uk' THEN '欧洲'
WHEN 'us' THEN '北美洲'
WHEN 'canada' THEN '北美洲'
ELSE '其他'
END AS area
FROM table_a
GROUP BY CASE name
WHEN 'cn' THEN '亚洲'
WHEN 'uk' THEN '欧洲'
WHEN 'us' THEN '北美洲'
WHEN 'canada' THEN '北美洲'
ELSE '其他'
END;
同样的,我们也可以用这个方法来判断工资的等级,并统计每一等级的人数。SQL代码如下:
SELECT CASE
WHEN salary <= 500 THEN '1'
WHEN salary > 500
AND salary <= 600 THEN '2'
WHEN salary > 600
AND salary <= 800 THEN '3'
WHEN salary > 800
AND salary <= 1000 THEN '4'
ELSE NULL
END AS salary_class, COUNT(*)
FROM Table_A
GROUP BY CASE
WHEN salary <= 500 THEN '1'
WHEN salary > 500
AND salary <= 600 THEN '2'
WHEN salary > 600
AND salary <= 800 THEN '3'
WHEN salary > 800
AND salary <= 1000 THEN '4'
ELSE NULL
END;
二,用一个SQL语句完成不同条件的分组。
按照国家和性别进行分组,得出结果如下
普通情况下,用UNION也可以实现用一条语句进行查询。但是那样增加消耗(两个Select部分),而且SQL语句会比较长。下面是一个是用Case函数来完成这个功能的例子
SELECT name, SUM(CASE
WHEN sex = '1' THEN population
ELSE 0
END) AS male, SUM(CASE
WHEN sex = '2' THEN population
ELSE 0
END) AS female
FROM table_a
GROUP BY name;
这样我们使用Select,完成对二维表的输出形式,充分显示了Case函数的强大。
三,根据条件有选择的UPDATE。
1)、将小于50w的国家增加15%的对应性别人口,大于60w的国家人口减少对应性别10%
UPDATE table_a
SET population =
CASE WHEN population >= 60 THEN population * 0.9
WHEN population < 50 THEN population * 1.15
ELSE population END;
2)、例,有如下更新条件
1.工资5000以上的职员,工资减少10%
2.工资在2000到4600之间的职员,工资增加15%
很容易考虑的是选择执行两次UPDATE语句,如下所示
--条件1
UPDATE Personnel SET salary = salary * 0.9 WHERE salary >= 5000;
--条件2
UPDATE Personnel SET salary = salary * 1.15
WHERE salary >= 2000 AND salary < 4600;
但是事情没有想象得那么简单,假设有个人工资5000块。首先,按照条件1,工资减少10%,变成工资4500。接下来运行第二个SQL时候,因为这个人的工资是4500在2000到4600的范围之内,需增加15%,最后这个人的工资结果是5175,不但没有减少,反而增加了。如果要是反过来执行,那么工资4600的人相反会变成减少工资。暂且不管这个规章是多么荒诞,如果想要一个SQL 语句实现这个功能的话,我们需要用到Case函数。代码如下:
UPDATE Personnel
SET salary = CASE
WHEN salary >= 5000 THEN salary * 0.9
WHEN salary >= 2000
AND salary < 4600 THEN salary * 1.15
ELSE salary
END;
这里要注意一点,最后一行的ELSE salary是必需的,要是没有这行,不符合这两个条件的人的工资将会被写成NUll,那可就大事不妙了。在Case函数中Else部分的默认值是NULL,这点是需要注意的地方。
四,变更主键。
这种方法还可以在很多地方使用,比如说变更主键这种累活。
一般情况下,要想把两条数据的Primary key,a和b交换,需要经过临时存储,拷贝,读回数据的三个过程,要是使用Case函数的话,一切都变得简单多了。
假设有如上数据,需要把主键a
和b
相互交换。用Case函数来实现的话,代码如下
UPDATE SomeTable
SET p_key = CASE
WHEN p_key = 'a' THEN 'b'
WHEN p_key = 'b' THEN 'a'
ELSE p_key
END
WHERE p_key IN ('a', 'b');
同样的也可以交换两个Unique key。需要注意的是,如果有需要交换主键的情况发生,多半是当初对这个表的设计进行得不够到位,建议检查表的设计是否妥当。
五,两个表数据是否一致的检查。
Case函数不同于DECODE函数。在Case函数中,可以使用BETWEEN,LIKE,IS NULL,IN,EXISTS等等。比如说使用IN,EXISTS,可以进行子查询,从而 实现更多的功能。
下面具个例子来说明,有两个表,tbl_A,tbl_B,两个表中都有keyCol列。现在我们对两个表进行比较,tbl_A中的keyCol列的数据如果在tbl_B的keyCol列的数据中可以找到,返回结果'Matched',如果没有找到,返回结果'Unmatched'。
要实现下面这个功能,可以使用下面两条语句
1)--使用IN的时候
SELECT keyCol
, CASE
WHEN keyCol IN (
SELECT keyCol
FROM tbl_B
) THEN 'Matched'
ELSE 'Unmatched'
END AS Label
FROM tbl_A;
2)--使用EXISTS的时候
SELECT keyCol,
CASE WHEN EXISTS ( SELECT * FROM tbl_B WHERE tbl_A.keyCol = tbl_B.keyCol ) THEN 'Matched' ELSE 'Unmatched' ENDLabel
FROM tbl_A;
使用IN和EXISTS的结果是相同的。也可以使用NOT IN和NOT EXISTS,但是这个时候要注意NULL的情况。
六,在Case函数中使用合计函数
假设有下面一个表
有的学生选择了同时修几门课程(100,200)也有的学生只选择了一门课程(300,400,500)。选修多门课程的学生,要选择一门课程作为主修,主修flag里面写入 Y。只选择一门课程的学生,主修flag为N(实际上要是写入Y的话,就没有下面的麻烦事了,为了举例子,还请多多包含)。
现在我们要按照下面两个条件对这个表进行查询
1.只选修一门课程的人,返回那门课程的ID
2.选修多门课程的人,返回所选的主课程ID
简单的想法就是,执行两条不同的SQL语句进行查询。
条件1
--条件1:只选择了一门课程的学生
SELECT std_id, MAX(class_id) AS main_class FROM Studentclass GROUP BY std_id HAVING COUNT(*) = 1;
执行结果1
STD_ID MAIN_class
300 4
400 5
500 6
条件2
--条件2:选择多门课程的学生 SELECT std_id, class_id AS main_class FROM Studentclass WHERE main_class_flg = 'Y' ;
执行结果2
STD_ID MAIN_class
100 1
200 3
如果使用Case函数,我们只要一条SQL语句就可以解决问题,具体如下所示
SELECT std_id
, CASE
WHEN COUNT(*) = 1 THEN MAX(class_id) --只选择一门课的学生
ELSE MAX(CASE
WHEN main_class_flg = 'Y' THEN class_id
ELSE NULL
END)
END AS main_class
FROM Studentclass
GROUP BY std_id;
运行结果
STD_ID MAIN_class
100 1
200 3
300 4
400 5
500 6
通过在Case函数中嵌套Case函数,在合计函数中使用Case函数等方法,我们可以轻松的解决这个问题。使用Case函数给我们带来了更大的自由度。
最后提醒一下使用Case函数的新手注意不要犯下面的错误
CASE col_1
WHEN 1 THEN 'Right'
WHEN NULL THEN 'Wrong'
END
在这个语句中When Null这一行总是返回unknown,所以永远不会出现Wrong的情况。因为这句实际表达的意思是
WHEN col_1 = NULL,这是一个错误的用法,这个时候我们应该选择用WHEN col_1 IS NULL。
七、小结
select 与 case结合使用最大的好处有两点,一是在显示查询结果时可以灵活的组织格式,二是有效避免了多次对同一个表或几个表的访问。
下面举个简单的例子来说明。例如表 students(id, name ,birthday, sex, grade),要求按每个年级统计男生和女生的数量各是多少,统计结果的表头为,年级,男生数量,女生数量。如果不用select case when,为了将男女数量并列显示,统计起来非常麻烦,先确定年级信息,再根据年级取男生数和女生数,而且很容易出错。用select case when写法如下:
SELECT grade, COUNT(CASE
WHEN sex = 1 THEN 1
ELSE NULL
END) male, COUNT(CASE
WHEN sex = 2 THEN 1
ELSE NULL
END) female
FROM students
GROUP BY grade;