SQL中PIVOT函数和CASE方法实现透视表的差异

为了解释清楚之间的差异,创建如下所示数据表

CREATE TABLE 销售
(商店名 VARCHAR(50),
 商品类型 VARCHAR(50),
 销售量 INT,
 日期 DATE)

INSERT INTO 销售
VALUES ('李宁','短袖',30,'2021/4/27'),
('李宁','短袖',40,'2021/4/28'),	
('李宁','短袖',50,'2021/4/29'),	
('李宁','裤子',60,'2021-4-27'),
('李宁','裤子',80,'2021-4-28'),
('李宁','裤子',90,'2021-4-29'),
('安踏','短袖',20,'2021-4-27'),
('安踏','短袖',61,'2021-4-28'),
('安踏','短袖',55,'2021-4-29'),
('安踏','裤子',56,'2021-4-27'),
('安踏','裤子',60,'2021-4-28'),
('安踏','裤子',78,'2021-4-29')

CASE 方法

  • 统计这段时间内各个商店各商品类型销售总额,并将商品类型列中的值转换为列标题
SELECT 商店名,
SUM(CASE WHEN 商品类型='短袖' THEN 销售量 END ) AS 短袖,
SUM(CASE WHEN 商品类型='裤子' THEN 销售量 END ) AS 裤子
FROM 销售
GROUP BY 商店名

商店名    短袖    裤子
安踏       136     194
李宁       120     230

此时功能既有求和又有行列转换,商店名类似EXCEL透视表功能中的行,商品类型类似 EXCEL透视表功能中的列,销售量类似EXCEL透视表功能中的值

  • 将商品类型列中的值转换为列标题
SELECT 商店名,日期,
SUM(CASE WHEN 商品类型='短袖' THEN 销售量 END ) AS 短袖,
SUM(CASE WHEN 商品类型='裤子' THEN 销售量 END ) AS 裤子
FROM 销售
GROUP BY 商店名,日期

商店名       日期         短袖  裤子
安踏      2021-04-27    20    56
李宁      2021-04-27    30    60
安踏      2021-04-28    61    60
李宁      2021-04-28    40    80
安踏      2021-04-29    55    78
李宁      2021-04-29    50    90 

此时功能表面上看仅有行列转换,虽然用到聚合函数进行求和,但实际上并没有数值上的变化,因为商店名和日期对应的短袖的销售数据只有1条,商店名日期类似EXCEL透视表功能中的行,商品类型类似 EXCEL透视表功能中的列,销售量类似EXCEL透视表功能中的值

PIVOT函数

  • 将商品类型列中的值转换为列标题
SELECT 商店名,[短袖],[裤子]
FROM 销售
PIVOT(SUM(销售量) FOR 商品类型 IN ([短袖],[裤子])) a

商店名   短袖    裤子
安踏        20    56
李宁        30    60
安踏        61    60
李宁        40    80
安踏        55    78
李宁        50    90

 明明SELECT语句中有商店名,怎么没有对商店名进行分组,为什么安踏和李宁出现三次,安踏短袖的销售数量不显示总和136,是不是有点像仅仅进行了行列转换?

这实际上与SQL语句的执行顺序有关,销售表中包含四列,分别为商店名,商品类型,销售量和日期,上述语句执行步骤类似如下:

1. 首先,对非聚合列进行分组,然后对聚合列进行统计

商店名,商品类型,销售日期为非聚合列,销售量为聚合列,商品类型既是非聚合列也是要成为列标题的列

SELECT 商店名,商品类型,销售日期,SUM(销售量)  FROM 销售 GROUP BY 商店名,商品类型, 销售日期

2.其次,将要成为列标题的值转化为透视列,值为聚合函数对应的值

具体为将商品类型列中的值转换为列标题,值为SUM(销售量)对应的值

3. 最后,从这个表中筛选出列

上述语句相当于筛选出商店名,短袖和裤子这三列

SELECT 商店名,日期,[短袖],[裤子]
FROM 销售
PIVOT(SUM(销售量) FOR 商品类型 IN ([短袖],[裤子])) a

商店名    日期    短袖    裤子
安踏    2021-04-27    20    56
李宁    2021-04-27    30    60
安踏    2021-04-28    61    60
李宁    2021-04-28    40    80
安踏    2021-04-29    55    78
李宁    2021-04-29    50    90 

SELECT 商店名,[短袖],[裤子] FROM 销售 PIVOT(SUM(销售量) FOR 商品类型 IN ([短袖],[裤子])) a 和 SELECT 商店名,日期,[短袖],[裤子] FROM 销售 PIVOT(SUM(销售量) FOR 商品类型 IN ([短袖],[裤子])) a本质上是一样的,只是最后筛选出的列不同,换句话说PIVOT函数会对源表中除聚合列以外的所有列进行分组GROUP BY,即使SELECT语句中没有出现一些非聚合列

为了实现这段时间内各个商店各商品类型销售总额,需要在源表上进行调整

  • 统计这段时间内各个商店各商品类型销售总额,并将商品类型列中的值转换为列标题
SELECT 商店名,[短袖],[裤子]
FROM (SELECT 商店名,商品类型,销售量 FROM 销售) b
PIVOT(SUM(销售量) FOR 商品类型 IN ([短袖],[裤子])) a

商店名    短袖    裤子
安踏       136     194
李宁       120     230

综上,无论是利用CASE还是PIVOT进行透视功能,需要搞清楚是仅仅要实现行列转换,还是需要分组统计后再进行行列转换,不同的需求SQL语句会有差异,另外,对同一需求CASE和PIVOT的思路也是存在差异的 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MS Query基础语法讲解: 一、单查询 单查询是指仅涉及一个的查询 1、查询指定列 例1、查询材料进货明细的定额名称及规格 SELECT 定额名称,规格 FROM [材料进货明细$] 注意:在excel,一个工作示是这样的:[工作名称$] select的意思是:查询 上面那一句SQL语句的意思就是:从材料进货明细取出定额名称及规格的值 例2、查询材料进货明细的详细记录 SELECT * FROM [材料进货明细$] 等价于: SELECT 序号, 定额名称,规格,日期,单位,数量 FROM [材料进货明细$] 注意:*的用法 2、查询经过计算的值 例3、查询材料进货明细的定额名称、规格、年份及数量 SELECT 定额名称,规格,year(日期) as 年份,数量 FROM [材料进货明细$] 注意:里面的年份已经通过了计算的了,成为一个新的变量。 加多一列自定义的列A厂: SELECT “A厂” ,定额名称,规格,year(日期) as 年份,数量 FROM [材料进货明细$] SELECT “A厂” as 工厂 ,定额名称,规格,year(日期) as 年份,数量 FROM [材料进货明细$] 比较一下上面两句SQL语句的区别,没有as 工厂与有as 工厂的区别 二、选择若干元组 1、消除取重复的行 例4、查询材料进货明细的定额名称 SELECT 定额名称 FROM [材料进货明细$] 该查询结果会包含很多重复的行。消除重复行的话,必须指定关键词 distinct SELECT distinct 定额名称 FROM [材料进货明细$] 2、查询满足条件的元组 例5、查询材料进货明细单位为“套”的所有记录 SELECT * FROM [材料进货明细$] where 单位= ‘套’ 本句语句,要学会where的用法: 要查询满足指定条件的元组,可以通过where子句实现。where子句查询条件是: 比较: =,>,<,>=,<=,!=,<>,!>,!<;not +上述比较运算符 确定范围: between and ,not between and 确定集合:in,not in 字符匹配:like,not like 空值:is null,is not null 多重条件:and,or,not 例6、查询材料进货明细数量在50—100之间的所有记录 SELECT * FROM [材料进货明细$] where 数量 between 50 and 100 如果是不在50-100之间的话,直接改成: SELECT * FROM [材料进货明细$] where 数量 not between 50 and 100 例7、查询材料进货明细单位为“只”或“支”的所有记录 SELECT * FROM [材料进货明细$] where 单位 in(‘只’,'支’) 3、字符匹配 可以用like来实现,通配符%和_ a、%代任意长度的字符串,如a%b示以a开头,以b结尾的任意的字符串 b、_代任意单个字符 例8、查询材料进货明细定额名称以“天津”开头的所有记录 SELECT * FROM [材料进货明细$] where 定额名称 like ‘天津%’ 例9、查询材料进货明细定额名称以“天津”开头且字符为4个的所有记录 SELECT * FROM [材料进货明细$] where 定额名称 like ‘天津__’ 例10、查询材料进货明细定额名称不以“天津”开头的所有记录 SELECT * FROM [材料进货明细$] where 定额名称 not like ‘天津%’ 4、涉及空值的查询 主要是以:null出现 例11、查询材料进货明细规格为空的的所有记录 SELECT * FROM [材料进货明细$] where 规格 is null 5、多条件查询 例12、查询材料进货明细定额名称为“天津三通”的并且数量大于30的所有记录 SELECT * FROM [材料进货明细$] where 定额名称 = ‘天津三通’ and 数量>30 三、order by 子句 desc(降序)、asc(升序) 例13、查询材料进货明细数量大于30的所有记录,并且要按照数量来降序排列。 SELECT * FROM [材料进货明细$] where 数量>30 order by 数量 desc 四、聚集函数 count(distinct/all 列名):统计元组个数 sum:求和 avg:求平均值 max:最大值 min:最小值 例14、查询材料进货明细天津大小头的最大数量。 SELECT max(数量) FROM [材料进货明细$] where 定额名称 = ‘天津大小头’ 或:SELECT max(数量) as 最大数量 FROM [材料进货明细$] where 定额名称 = ‘天津大小头’ 2. Excel源数据及分析下载:Excel数据透视教程:分类百分比 SQL语句: select *, Hz1.分类销量/Hz2.分类销量 as 分类百分比 from (select 品种,分公司, sum(数量) as 分类销量 from [数据$] group by 品种,分公司) Hz1, (select 分公司, sum(数量) as 分类销量 from [数据$] group by 分公司) Hz2 where hz1.分公司=Hz2.分公司 SQL语句解释: select 品种,分公司, sum(数量) as 分类销量 from [数据$] group by 品种,分公司 实现对品种、分公司两字段分组的统计求和 select 分公司, sum(数量) as 分类销量 from [数据$] group by 分公司 实现对分公司字段分组的统计求和 对分公司分组统计求和数是对品种、分公司两字段分组统计求和项目再对不同品种的总就和,也就是后者包含前者。 整句语句的意思就是,将两个查询结果作为新的查询分别命名为Hz1、Hz2,用 ”where hz1.分公司=Hz2.分公司“来组合数据, 没有条件的制约的话,将统计的结果再进行除数运算, 各品种的分组统计数(分组含品种字段)除以各品种已求和了的分组统计数(分组不含品种字段)求得所占比率, 最后在字段单元格设置为百分数就可以了。 3 在Excel使用MS Query查询外部数据库的内容的优点是:不用设置公式、编VBA代码、源数据库不用打开。 但要注意:源数据库的记录要有字段名,由于设置查询时的路径固定,。 因此源数据库文件不能随意移动(如确实要移动可以通过手工修改查询或VBA解决) 以下示例采用MS Query在“查询”工作簿查询关闭的“销售”工作簿sheet1的指定 “店铺”和指定“颜色”的内容(sheet1有“店铺”、“数量”、“颜色”等字段名及若干数据)。 操作前请先确定是否安装有MS Query。附上举例文件,请解压到D盘根目录下: 销售.xls为源数据,查询.xls设置了msquery查询。 下载:MS Query查询未打开工作簿的内容例子 1、 新建一个工作,选择菜单【数据】—【导入外部数据】—【新建数据库查询】, 界面如图,由于查询excel数据库的内容,因此选择【Excel Files*】并确定; 2、 弹出〖选择工作簿〗对话框,选择“销售”工作簿,〖确定〗; 3、 弹出〖选择列〗对话框,如果此时弹出“没用内容”,确定后在〖选项〗将“系统”勾上。 将所选工作簿的各个工作及工作的字段名添加到查询结果,全选可直接将工作名添加, 〖下一步〗〖下一步〗,选择“在MS query继续编辑查询”; 4、 弹出MS Query查询编辑,点击【显示/隐藏条件】图标,在“条件字段”添加“店铺”, 值改为“[店]”(方括号内容随意),再添加个条件为“颜色”,值改为“[色]”,点击【将数据返回Excel】 5、 回到excel的“导入数据”对话框,点击〖参数〗,选“店”字段,再选择“从下列单元格获取数据”, 选择一个用来更改查询关键字的单元格(如B1),并勾选“单元格值更改时自动刷新”, “色”字段改成从单元格“B2”获取,〖确定〗。数据放置位置选择“A3”。〖确定〗。 6、 当更改B1和B2单元格的内容(做个数据有效性)时,A3及以下的数据会即时刷新。 此法对于需要经常在局域网查询数据非常方便,比如:数据放在局域网内的一台主机上,通过MS Query即可不打开工作簿查询数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值