mysql 分组求和_MySQL数据分析:汇总分析

9d33bffb6f6ddf0bf5d4310252a373fc.png

开始之前,先考虑一个问题:如何计算各科的平均成绩并且得出平均成绩大于等于80分的课程并降序排列?

遇到业务问题,先不要着急,捋一下思路:

要计算每一门课程平均成绩,然后根据得出的结果,进行大于等于80分的条件查询,对查询结果进行降序排列。

这么看来,就可以解决这个业务问题了

接下来,我们需要解决的问题就是,每一步骤如何去解。

3992ad4da0089357a8e43780358f50f6.png
此四张表表为以下实例所用

目录

  • 汇总函数
  • 分组
  • 对分组结果指定条件
  • 排序
  • 用SQL解决业务问题分析思路

一开始的问题中,要求我们计算平均成绩,平均成绩用SQL怎么来计算?这便是我们这节的内容了,这里不仅仅介绍平均值,还有计数、求和、最大值、最小值的汇总函数的介绍。

先看一下本节导图:

af77b09accb0b7fba50cb2027ecf67bb.png

1)count() 求某列的行数

很容易理解,count(列名)就是求某列的行数,值得注意的一点是该列不会计算空值的行数。举例:

-- 查询共有几名教师

f604b5b776bae6cd32fe24ddf8f19053.png
-- 查询教师表共有多少行
SELECT COUNT(*) FROM teacher;

04890a450baad934334a2d4b9bf9f030.png

如果列中有重复值,我们计数不想计算重复值,怎么办呢?我们可以使用distinct来解决:

-- 查询成绩表里共有几个学生的成绩
SELECT COUNT(DISTINCT 学号) FROM score;

a69ffa520e70012d504badc6f4962b9e.png

2)sum() 对某列数据求和

求和,就是对某一列的数值进行求和,只能对数值进行计算。举例:

--  对所有成绩求和
SELECT SUM(成绩) FROM score;

191fff633233e4d11ec5122f85929d48.png

3)avg() 对某列数值求平均值

同样,平均值的计算只能对数值进行计算:

-- 对所有成绩求平均值
SELECT AVG(成绩) FROM score;

b9c0cf8b39661e385f5803d906da3844.png

4)max() 求某列数据的最大值、min() 求某列数据的最小值

-- 获取所有成绩中的最大成绩
SELECT MAX(成绩),MIN(成绩) FROM score;

12e2e7621cd310fdcc70a307a1215d2d.png

分组

问题中,我们提到,需要知道每科成绩的平均成绩,那么我们就需要进行分组。

SQL中,group by语句可以根据一列或者多列对结果集进行分组。举例:

fccfec196f4e870f4414ff9626579938.png
-- 计算每一科课程的平均成绩
SELECT 课程号,AVG(成绩) FROM score GROUP BY 课程号;

7b4f39d03812f4491cc38b34ee8d2e18.png

在上篇文章中,我们就有简单的介绍SQL语句执行顺序:先执行from从哪个表获取数据,再执行select语句;

一朵云:MySql数据分析:简单查询​zhuanlan.zhihu.com
5f1f2b7a1fb329d824b0e0f289130cca.png

这里我们从成绩表获取数据,使用group by语句将数据按某种规则进行分组;然后在分组的结果上进行计算count();最后select组合结果,把上一步的每一组计算结果总结到一个表中

对分组条件指定条件

在一开始的问题里,要求“计算各科的平均成绩并且得出平均成绩大于等于80分”,以上两节我们得到了计算每天一科的平均成绩,现在对平均成绩指定条件:“大于等于80分”,我们使用having子句

7c3dea9e8f79e7d8d79ce22524ea111d.png

having子句与where子句都是有条件的选取数据,不同的是where不能与汇总函数一起使用。

-- 计算平均成绩大于等于80分的课程;
SELECT 课程号,AVG(成绩) FROM score GROUP BY 课程号 HAVING AVG(成绩)>=80;

那是不是说,having子句的顺序也是在select结果汇总的前边呢?是的,having子句是对group by 的分组结果指定条件,比如要求大于等于80分,筛选出结果后,在进行结果汇总。

582a07bf7e6eac4b79e4a8875101daee.png
-- 对教师表根据教师姓名排序
SELECT * FROM teacher ORDER BY 教师姓名;

e5449633e01ee6c8ae8546e7f6f4532d.png

我们发现,空值Null排在了最前面,所以:含有空值的列在排序时候,空值null会在开头,当数据量很大想看空值的情况,就可以用这个排序。

另外,在补充一个limit语句从查询结果中取出指定行,比如,我们如果从刚才的查询结果中只取第一行:

-- 计算平均成绩大于等于80分的课程并根据成绩降序排,并获取第一行
SELECT 课程号,AVG(成绩) FROM score GROUP BY 课程号 HAVING AVG(成绩)>=80 ORDER BY AVG(成绩) DESC LIMIT 1;

d9471ec9c5b68e340c355e202312d843.png

接下来我们进行一个总结。

用SQL解决业务问题分析思路

简单来说:明确问题,将问题翻译成大白话,逐步进行拆解,并写出分析思路和对应的SQL思路。

1) 明确问题,将问题翻译成大白话:

“计算各科的平均成绩并且得出平均成绩大于等于80分的课程并降序排列”翻译成大白话就是:

“计算每一门课程平均成绩,然后根据得出的结果,进行大于等于80分的条件查询,对查询结果进行降序排列”。

2) 逐步进行拆解,并写出分析思路和对应的SQL思路:

① 对课程号进行分组,计算每一门课程的平均成绩;

② 对①的结果指定条件“>=80”;

③ 对②的结果进行降序排列;

我们可以把拆解后的思路套用到下方的公式中:

select 查询结果
from 从那张表中查找数据
where 查询条件(运算符、模糊查询)
group by 分组(每个)
having 对分组结果指定条件
order by 对查询结果排序
limit 从查询结果中取出指定行;

试一下吧:

select 查询结果[课程号,avg(成绩)]
from 从那张表中查找数据[成绩表score]
where 查询条件(运算符、模糊查询)[No]
group by 分组(每个)[课程号]
having 对分组结果指定条件[avg(成绩)>=80]
order by 对查询结果排序[avg(成绩)desc]
limit 从查询结果中取出指定行;[No]

这样子,问题是不是就迎刃而解呢?

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值