mysql数据库分组函数_MySQL数据库之MySQL最常用分组聚合函数

最新推荐文章于 2024-09-07 09:29:09 发布

weixin_40003512

最新推荐文章于 2024-09-07 09:29:09 发布

阅读量285

点赞数

文章标签： mysql数据库分组函数

本文链接：https://blog.csdn.net/weixin_40003512/article/details/114863559

版权

本文主要向大家介绍了MySQL数据库之MySQL最常用分组聚合函数，通过具体的内容向大家展现，希望对大家学习MySQL数据库有所帮助。

一、聚合函数(aggregation function)---也就是组函数

在一个行的集合(一组行)上进行操作，对每个组给一个结果。

常用的组函数：

AVG([distinct] expr)

求平均值

COUNT({*|[distinct] } expr)

统计行的数量

MAX([distinct] expr)

求最大值

MIN([distinct] expr)

求最小值

SUM([distinct] expr)

求累加和

①每个组函数接收一个参数

②默认情况下，组函数忽略列值为null的行，不参与计算

③有时，会使用关键字distinct剔除字段值重复的条数

注意：

1)当使用组函数的select语句中没有group by子句时，中间结果集中的所有行自动形成一组，然后计算组函数；

2)组函数不允许嵌套，例如：count(max(…))；

3)组函数的参数可以是列或是函数表达式；

4)一个SELECT子句中可出现多个聚集函数。

实验演示用表：

mysql> select * from salary_tab;

+--------+---------+

| userid | salary |

+--------+---------+

| 1 | 1000.00 |

| 2 | 2000.00 |

| 3 | 3000.00 |

| 4 | NULL |

| 5 | 1000.00 |

+--------+---------+

5 rows in set (0.00 sec)

mysql> use TENNIS

mysql> show tables;

+-------------------+

| Tables_in_TENNIS |

+-------------------+

| COMMITTEE_MEMBERS |

| MATCHES |

| PENALTIES |

| PLAYERS |

| TEAMS |

+-------------------+

5 rows in set (0.00 sec)

1、count函数

①count(*)：返回表中满足where条件的行的数量

mysql> select count(*) from salary_tab where salary=‘1000‘;

+----------+

| count(*) |

+----------+

| 2 |

+----------+

mysql> select count(*) from salary_tab;　　#没有条件，默认统计表数据行数

+----------+

| count(*) |

+----------+

| 5 |

+----------+

②count(列)：返回列值非空的行的数量

mysql> select count(salary) from salary_tab;

+---------------+

| count(salary) |

+---------------+

| 4 |

+---------------+

③count(distinct 列)：返回列值非空的、并且列值不重复的行的数量

mysql> select count(distinct salary) from salary_tab;

+------------------------+

| count(distinct salary) |

+------------------------+

| 3 |

+------------------------+

2、max和min函数---统计列中的最大最小值

mysql> select max(salary) from salary_tab;

+-------------+

| max(salary) |

+-------------+

| 3000.00 |

+-------------+

mysql> select min(salary) from salary_tab;

+-------------+

| min(salary) |

+-------------+

| 1000.00 |

+-------------+

注意：如果统计的列中只有NULL值，那么MAX和MIN就返回NULL

3、sum和avg函数---求和与求平均

！！表中列值为null的行不参与计算

mysql> select sum(salary) from salary_tab;

+-------------+

| sum(salary) |

+-------------+

| 7000.00 |

+-------------+

mysql> select avg(salary) from salary_tab;

+-------------+

| avg(salary) |

+-------------+

| 1750.000000 |

+-------------+

mysql> select avg(ifnull(salary,0)) from salary_tab;

+-----------------------+

| avg(ifnull(salary,0)) |

+-----------------------+

| 1400.000000 |

+-----------------------+

注意：要想列值为NULL的行也参与组函数的计算，必须使用IFNULL函数对NULL值做转换。

二、分组SELECT

SELECT select_expr [, select_expr ...]

[FROM table_references

[PARTITION partition_list]

[WHERE where_condition]

[GROUP BY {col_name | expr | position}

[ASC | DESC], ... [WITH ROLLUP]]

[HAVING where_condition]

[ORDER BY {col_name | expr | position}

[ASC | DESC], ...]

[LIMIT {[offset,] row_count | row_count OFFSET offset}]

分组SELECT的基本格式：

select [聚合函数] 字段名 from 表名

[where 查询条件]

[group by 字段名]

[having 过滤条件]

1、group by子句

根据给定列或者表达式的每一个不同的值将表中的行分成不同的组，使用组函数返回每一组的统计信息

规则：

①出现在SELECT子句中的单独的列，必须出现在GROUP BY子句中作为分组列

②分组列可以不出现在SELECT子句中

③分组列可出现在SELECT子句中的一个复合表达式中

④如果GROUP BY后面是一个复合表达式，那么在SELECT子句中，它必须整体作为一个表达式的一部分才能使用。

1)指定一个列进行分组

mysql> select salary,count(*) from salary_tab

-> where salary>=2000

-> group by salary;

+---------+----------+

| salary | count(*) |

+---------+----------+

| 2000.00 | 1 |

| 3000.00 | 1 |

+---------+----------+

2)指定多个分组列，‘大组中再分小组’

mysql> select userid,count(salary) from salary_tab

-> where salary>=2000

-> group by salary,userid;

+--------+---------------+

| userid | count(salary) |

+--------+---------------+

| 2 | 1 |

| 3 | 1 |

+--------+---------------+

3)根据表达式分组

mysql> select year(payment_date),count(*)

-> from PENALTIES

-> group by year(payment_date);

+--------------------+----------+

| year(payment_date) | count(*) |

+--------------------+----------+

| 1980 | 3 |

| 1981 | 1 |

| 1982 | 1 |

| 1983 | 1 |

| 1984 | 2 |

+--------------------+----------+

5 rows in set (0.00 sec)

4)带有排序的分组：如果分组列和排序列相同，则可以合并group by和order by子句

mysql> select teamno,count(*)

-> from MATCHES

-> group by teamno

-> order by teamno desc;

+--------+----------+

| teamno | count(*) |

+--------+----------+

| 2 | 5 |

| 1 | 8 |

+--------+----------+

2 rows in set (0.00 sec)

mysql> select teamno,count(*)

-> from MATCHES

-> group by teamno desc;　　#可以把desc(或者asc)包含到group by子句中简化

+--------+----------+

| teamno | count(*) |

+--------+----------+

| 2 | 5 |

| 1 | 8 |

+--------+----------+

2 rows in set (0.00 sec)

2、GROUP_CONCAT()函数

函数的值等于属于一个组的指定列的所有值，以逗号隔开，并且以字符串表示。

例1：对于每个球队，得到其编号和所有球员的编号

mysql> select teamno,group_concat(playerno)

-> from MATCHES

-> group by teamno;

+--------+------------------------+

| teamno | group_concat(playerno) |

+--------+------------------------+

| 1 | 6,6,6,44,83,2,57,8 |

| 2 | 27,104,112,112,8 |

+--------+------------------------+

2 rows in set (0.01 sec)

如果没有group by子句，group_concat返回一列的所有值

例2：得到所有的罚款编号列表

mysql> select group_concat(paymentno)

-> from PENALTIES;

+-------------------------+

| group_concat(paymentno) |

+-------------------------+

| 1,2,3,4,5,6,7,8 |

+-------------------------+

1 row in set (0.00 sec)

3、with rollup子句：用来要求在一条group by子句中进行多个不同的分组

用的比较少点，但是有时可以根据具体的需求使用

如果有子句GROUP BY E1,E2,E3,E4 WITH ROLLUP

那么将分别执行以下分组：[E1,E2,E3,E4]、[E1,E2,E3]、[E1,E2]、[E1]、[]

注意：[ ]表示所有行都分在一组中

示例：按照球员的性别和居住城市，统计球员的总数；统计每个性别球员的总数；统计所有球员的总数

mysql> select sex,town,count(*)

-> from PLAYERS

-> group by sex,town with rollup;

+-----+-----------+----------+

| sex | town | count(*) |

+-----+-----------+----------+

| F | Eltham | 2 |

| F | Inglewood | 1 |

| F | Midhurst | 1 |

| F | Plymouth | 1 |

| F | NULL | 5 |

| M | Douglas | 1 |

| M | Inglewood | 1 |

| M | Stratford | 7 |

| M | NULL | 9 |

| NULL | NULL | 14 |

+-----+-----------+----------+

10 rows in set (0.00 sec)

4、HAVING子句：对分组结果进行过滤

注意：

不能使用WHERE子句对分组后的结果进行过滤

不能在WHERE子句中使用组函数，仅用于过滤行

mysql> select playerno

-> from PENALTIES

-> where count(*)>1

-> group by playerno;

ERROR 1111 (HY000): Invalid use of group function

因为WHERE子句比GROUP BY先执行，而组函数必须在分完组之后才执行，且分完组后必须使用having子句进行结果集的过滤。

SELECT select_expr [, select_expr ...]

FROM table_name

[WHERE where_condition]

[GROUP BY {col_name | expr} [ASC | DESC], ... [WITH ROLLUP]]

[HAVING where_condition]

！！！having子语句与where子语句区别：

where子句在分组前对记录进行过滤；

having子句在分组后对记录进行过滤

mysql> select salary,count(*) from salary_tab

-> where salary>=2000

-> group by salary

-> having count(*)>=0;

+---------+----------+

| salary | count(*) |

+---------+----------+

| 2000.00 | 1 |

| 3000.00 | 1 |

+---------+----------+

1)HAVING可以单独使用而不和GROUP BY配合,如果只有HAVING子句而没有GROUP BY，表中所有的行分为一组

2)HAVING子句中可以使用组函数

3)HAVING子句中的列，要么出现在一个组函数中，要么出现在GROUP BY子句中(否则出错)

mysql> select town,count(*)

-> from PLAYERS

-> group by town

-> having birth_date>‘1970-01-01‘;

ERROR 1054 (42S22): Unknown column ‘birth_date‘ in ‘having clause‘

mysql> select town,count(*)

-> from PLAYERS

-> group by town

-> having town in (‘Eltham‘,‘Midhurst‘);

+----------+----------+

| town | count(*) |

+----------+----------+

| Eltham | 2 |

| Midhurst | 1 |

+----------+----------+

2 rows in set (0.00 sec)

三、集合查询操作

union用于把两个或者多个select查询的结果集合并成一个

SELECT ...

UNION [ALL | DISTINCT]

SELECT ...

[UNION [ALL | DISTINCT]

SELECT ...]

默认情况下，UNION = UNION DISTINCT

①进行合并的两个查询，其SELECT列表必须在数量和对应列的数据类型上保持一致；

②默认会去掉两个查询结果集中的重复行；默认结果集不排序；

③最终结果集的列名来自于第一个查询的SELECT列表

UNION ALL不去掉结果集中重复的行

注：联合查询结果使用第一个select语句中的字段名

mysql> select * from t1;

+------+------+

| num | addr |

+------+------+

| 123 | abc |

| 321 | cba |

+------+------+

2 rows in set (0.00 sec)

mysql> select * from t2;

+------+------+

| id | name |

+------+------+

| 1 | a |

| 2 | A |

+------+------+

2 rows in set (0.00 sec)

mysql> select * from t1

-> union

-> select * from t2;

+------+------+

| num | addr |

+------+------+

| 123 | abc |

| 321 | cba |

| 1 | a |

| 2 | A |

+------+------+

4 rows in set (0.00 sec)

如果要对合并后的整个结果集进行排序，ORDER BY子句只能出现在最后面的查询中

注意：

在去重操作时，如果列值中包含NULL值，认为它们是相等的

以上就介绍了MySQL的相关知识，希望对MySQL有兴趣的朋友有所帮助。了解更多内容，请关注职坐标数据库MySQL频道！

weixin_40003512

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫