MySQL学习笔记3——条件查询和聚合函数

一、条件查询语句

WHERE 和 HAVING 的区别:

  • WHERE是直接对表中的字段进行限定,来筛选结果;
  • HAVING则需要跟分组关键字GROUP BY一起使用,通过对分组字段或分组计算函数进行限定,来筛选结果。

虽然它们都是对查询进行限定,却有着各自的特点和适用场景。

WHERE

WHERE关键字的特点是,直接用表的字段对数据集进行筛选。如果需要通过关联查询从其他的表获取需要的信息,那么执行的时候,也是先通过WHERE条件进行筛选,用筛选后的比较小的数据集进行连接。这样一来, 连接过程中占用的资源比较少,执行效率也比较高。

HAVING

HAVING不能单独使用,必须要跟GROUP BY 一起使用。

我们可以把GROUP BY理解成对数据进行分组,方便我们对组内的数据进行统计计算。

它们两个典型的区别就是:

  • 如果需要通过连接从关联表中获取需要的数据,WHERE 是先筛选后连接,而HAVING是先连接后筛选。
  • WHERE可以直接使用表中的字段作为筛选条件,但不能使用分组中的计算函数作为筛选条件;HAVING必须要与GROUP BY配合使用,可以把分组计算的函数和分组字段作为筛选条件。

这决定了,在需要对数据进行分组统计的时候,HAVING 可以完成WHERE不能完成的任务。这是因为,在查询语法结构中,WHERE在GROUP BY之前,所以无法对分组结果进行筛选。HAVING在GROUP BY之后,可以使用分组字段和分组中的计算函数,对分组的结果集进行筛选,这个功能是WHERE无法完成的。

这么说可能不太好理解,举个小例子理解一下。假如超市经营者提出,要查询一下是哪个收银员、在哪天卖了2单商品。

这种必须先分组才能筛选的查询,用WHERE语句实现就比较难,我们可能要分好几步,通过把中间结果存储起来,才能搞定。但是用HAVING,则很轻松,代码如下:

SELECT
	a. transdate, c.operatorname
FROM 
	demo. transactionhead AS a
JOIN
	demo. transactiondetails AS b ON (a. transactionid = b. transactionid)
JOIN
	demo.operator AS C ON (a.operatorid = c. operatorid)
GROUP BY a. transdate, c. operatorname
HAVING count(*)=2; 	--销售了2单

不过需要注意的是,WHERE和HAVING也不是互相排斥的,也可以在一 个查询里面同使用WHERE和HAVING。

二、聚合函数

MySQL中有5种聚合函数较为常用,分别是:

  • 求和函数SUM)
    可以返回指定字段值的和。
  • 求平均函数AVG()
  • 最大值函数MAX()
  • 最小值函数MIN()
  • 计数函数COUNT()

先创建三个表,基于这三个表的基础上对聚合函数进行操作理解:

-- 创建销售明细表
CREATE TABLE demo.transactiondetails
(
transactionid INT NOT NULL,
itemnumber INT NOT NULL,
quantity INT,
price DECIMAL(10,2),
salesvalue DECIMAL(10,2),
-- 联合主键
PRIMARY KEY(transactionid,itemnumber)
);

销售明细表(transactiondetails):
在这里插入图片描述
销售单头表(transactionhead):
在这里插入图片描述
商品信息表(goodmaster):
在这里插入图片描述

1、SUM()

SUM () 函数可以返回指定字段值的和。我们可以用它来获得用户某个门店,每天、每种商品的销售总计数据:

SELECT
	LEFT(b.transdate, 10),  -- 从关联表获取交易时间,并且通过LEFT函数,获取交易的年月日
	c.goodsname,					  -- 从关联表获取商品名称
	SUM(a.quantity),				-- 数量求和
	SUM(a.salesvalue)				-- 金额求和
FROM
	demo.transactiondetails a
		JOIN
	demo.transactionhead b ON (a.transactionid = b. transactionid)
		JOIN
	demo.goodmaster c ON (a.itemnumber = c.itemnumber)
GROUP BY LEFT(b.transdate,10), c.goodsname				-- 分组
ORDER BY LEFT(b.transdate,10), c.goodsname;				-- 排序

查询结果:
在这里插入图片描述

这里引入了两个关键字:

  • LEFT(str, n):表示返回字符串str最左边的n个字符。
  • ORDER BY:表示按照指定的字段排序。

需要注意的是,求和函数获取的是分组中的合计数据,所以要对分组的结果有准确的把握,否则就很容易搞错。这也就是说,我们要知道是按什么字段进行分组的。

  • 如果是按多个字段分组,就要知道字段之间有什么样的层次关系;
  • 如果是按照以字段作为变量的某个函数进行分组的,就要知道这个函数的返回值是什么,返回值又是如何影响分组的等。

2、AVG()、MAX()、MIN()

AVG()
首先,我们来学习下计算平均值的函数AVG ()。它的作用是,通过计算分组内指定字段值的和,以及分组内的记录数,算出分组内指定字段的平均值。
举个例子,如果用户需要计算每天、每种商品,平均一次卖出多少个、多少钱,这个时候,我们就可以用到AVG () 函数了如下所示:

SELECT
	LEFT(a. transdate,10),
	c.goodsname,
	AVG (b.quantity),		-- 平均数量
	AVG (b.salesvalue)		-- 平均金额
FROM
	demo. transactionhead a
		JOIN
	demo. transactiondetails b ON (a.transactionid = b.transactionid)
		JOIN
	demo. goodmaster c ON (b.itemnumber = c.itemnumber )
GROUP BY LEFT(a. transdate,10) ,c.goodsname
ORDER BY LEFT(a. transdate,10) ,c.goodsname;

查询结果:
在这里插入图片描述
MAX()、MIN()
MAX()表示获取指定字段在分组中的最大值,MIN()表示获取指定字段在分组中的最小值。它们的实现原理差不多。

我们还是来看具体的例子。假如户要求计算每天里的一次销售的最大数量和最大金额,就可以用下面的代码,得到我们需要的结果

SELECT
	LEFT(a. transdate,10),
	MAX(b.quantity),
	MAX(b.salesvalue)
FROM
	demo. transactionhead a
		JOIN
	demo. transactiondetails b ON (a.transactionid = b.transactionid)
		JOIN
	demo. goodmaster c ON (b.itemnumber = c.itemnumber )
GROUP BY LEFT(a. transdate,10) ,c.goodsname
ORDER BY LEFT(a. transdate,10) ,c.goodsname;

注意,MAX (字段)这个函数返回分组集中最大的那个值。如果你要查询MAX (字段1)和MAX (字段2),而它们是相互独立、分别计算的,千万不要想当然地认为结果在同一条记录上。

3、COUNT()

通过COUNT (),我们可以了解数据集的大小,这对系统优化十分重要。

比如分页策略,这个策略能够实现的一个关键,就是要计算出符合条件的记录一共有多少条,之后才能计算出一共有几页、能不能翻页或跳转。

要计算记录数,就要用到COUNT()函数了。这个函数有两种情况。

  • COUNT (*) :统计一共有多少条记录;
  • COUNT (字段) :统计有多少个不为空的字段值。

COUNT (*)
如果COUNT (*)与GROUP BY 一起使用,就表示统计分组内有多少条数据。它也可以单独使用,这就相当于数据集全体是一个分组,统计全部数据集的记录数。

那么,如果超市经营者想知道,每天、每种商品都有几次销售,我们就需要按天、按商品名称,进行分组查询:

SELECT
	LEFT(a.transdate, 10), c.goodsname, COUNT(*) -- 统计销售次数
FROM
	demo. transactionhead a
		JOIN
	demo. transactiondetails b ON (a.transactionid = b.transactionid)
		JOIN
	demo. goodmaster c ON (b.itemnumber = c.itemnumber )
GROUP BY LEFT(a. transdate,10) ,c.goodsname
ORDER BY LEFT(a. transdate,10) ,c.goodsname;

运行结果:
在这里插入图片描述

COUNT (字段)
COUNT (字段)用来统计分组内这个字段的值出现了多少次。如果字段值是空,就不统计。
在这里插入图片描述
针对这个表:

  • 如果我们要统计字段"cashierNo" 出现了多少次,就要用到函数COUNT (cashierNo), 结果是3次;
  • 如果我们要统计字段"memberId" 出现了多少次,就要用到函数COUNT (memberId), 结果是1次。
  • 21
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值