目录
1. CRUD介绍
- 表的增删查改简称CRUD:Create(新增),Retrieve(查找),Update(修改),Delete(删除)。
- CRUD的操作对象是对表当中的数据,是典型的DML(Data Manipulation Language)数据操作语言。
复习:SQL语句可分为如下三类:
- DDL(Data Definition Language)数据定义语言,用来维护存储数据的结构。比如create语句、drop语句、alter语句等。
- DML(Data Manipulation Language)数据操作语言,用来对数据进行操作。比如insert语句、delete语句、update语句等。
- DCL(Data Control Language)数据控制语言,主要负责权限管理和事务。比如grant语句、revoke语句、commit语句。
注: DML中又单独分了一个DQL(Data Query Language)数据查询语言,比如select语句、from语句、where语句等。
此篇大多是DQL(Data Query Language)数据查询语言。
先看个有用的面试题:SQL查询中各个关键字的执行先后顺序: from > on> join > where > group by > with > having > select > distinct > order by > limit
2. Create 新增
因为MySQL在默认情况下不区分大小写,所以平时都习惯用小写了,看到大写能懂就行。
Create新增数据的SQL如下:
insert [into] table_name [(column1 [, column2] ...)] values (value_list1) [, (value_list2)] ...;
insert [into] table_name [(column1 [, column2] ...)]
values (value_list1) [, (value_list2)] ...;
- [ ]中代表的是可选项, 可以不加。
- SQL中的每个value_list都表示插入的一条记录,每个value_list都由若干待插入的列值组成。
- SQL中的column列表,用于指定每个value_list中的各个列值应该插入到表中的哪一列。
为了进行演示,下面创建一个学生表,表当中包含自增长的主键id、学号、姓名和QQ号。如下:
创建表完毕后查看表结构,可以看到表结构如下:
2.1 单行数据+全列插入
下面使用insert语句向学生表中插入记录,每次向表中插入一条记录,并且插入记录时不指定column列表,表示按照表中默认的列顺序进行全列插入,因此插入的每条记录中的列值需要按表列顺序依次列出。如下:
2.2 多行数据+指定列插入
使用insert语句也可以一次向表中插入多条记录,插入的多条记录之间使用逗号隔开,并且插入记录时可以只指定某些列进行插入。如下:
注意:在插入记录时,只有允许为空的列或自增长字段可以不指定值插入,不允许为空的列必须指定值插入,否则会报错。
2.3 插入否则更新
向表中插入记录时,如果待插入记录中的主键或唯一键已经存在,那么就会因为主键冲突或唯一键冲突导致插入失败。如下:
这时可以选择性的进行同步更新操作:
- 如果表中没有冲突数据,则直接插入数据。
- 如果表中有冲突数据,则将表中的数据进行更新。
插入否则更新的SQL如下:
INSERT ... ON DUPLICATE UPDATE column1=value1 [, column2=value2] ...;
insert... on duplicate update column1=value1 [, column2=value2] ...;
- SQL中大写的表示关键字,[ ]中代表的是可选项。
- SQL中INSERT之后语法与之前的INSERT语句相同。
- UPDATE后面的column=value,表示当插入记录出现冲突时需要更新的列值。
比如向学生表中插入记录时,如果没有出现主键冲突则直接插入记录,如果出现了主键冲突,则将表中冲突记录的学号和姓名进行更新。如下:
执行插入否则更新的SQL后,可以通过受影响的数据行数来判断本次数据的插入情况:
- 0 rows affected:表中有冲突数据,但冲突数据的值和指定更新的值相同。
- 1 row affected:表中没有冲突数据,数据直接被插入。
- 2 rows affected:表中有冲突数据,并且数据已经被更新。
2.4 替换数据
replace... on duplicate update column1=value1 [, column2=value2] ...;
- 如果表中没有冲突数据,则直接插入数据。
- 如果表中有冲突数据,则先将表中的冲突数据删除,然后再插入数据。
要达到上述效果,只需要在插入数据时将SQL语句中的INSERT改为REPLACE即可。比如:
执行替换数据的SQL后,也可以通过受影响的数据行数来判断本次数据的插入情况:
- 1 row affected:表中没有冲突数据,数据直接被插入。
- 2 rows affected:表中有冲突数据,冲突数据被删除后重新插入。
3. Retrieve 查找
查找数据的SQL如下:
select [distinct] {* | {column1 [, column2] ...}} from table_name [where ...] [order by ...] [limit] ...;
- [ ]中代表的是可选项, 可以不加。
- { }中的 | 代表可以选择左侧的语句或右侧的语句。
select [distinct] {* | {column1 [, column2] ...}}
from table_name [where ...] [order by ...] [limit] ...;
为了进行演示,下面创建一个成绩表,表当中包含自增长的主键id、姓名以及该同学的语文成绩、数学成绩和英语成绩。如下:
创建表完毕后查看表结构,可以看到表结构如下:
接下来向表中插入几条测试记录,以供我们进行查找。如下:
3.1 select 查询
全列查询
在查询数据时直接用*代替column列表,表示进行全列查询,这时将会显示被筛选出来的记录的所有列信息。如下:
注意:通常情况下不建议使用*
进行全列查询,因为被查询到的数据需要通过网络从MySQL服务器传输到本主机,查询的列越多也就意味着需要传输的数据量越大,此外,进行全列查询还可能会影响到索引的使用(索引后面讲)。
指定列查询:
在查询数据时也可以只对指定的列进行查询,这时将需要查询的列在column列表列出即可。如下:
表达式查询:
查询数据时,column列表中除了能罗列表中存在的列名外,我们也可以将表达式罗列到column列表中。如下:
因为select不仅能够用来查询数据,还可以用来计算某些表达式或执行某些函数。如下:
如果我们将表达式罗列到column列表,那么每当一条记录被筛选出来时就会执行这个表达式,然后将表达式的计算结果作为这条记录的一个列值进行显示。
column列表中的表达式可以包含表中已有的字段,这时每当一条记录被筛选出来时,就会将记录中对应的列值提供给表达式进行计算。如下:
column列表中的表达式中也可以包含多个表中已有的字段,这时我们就可以通过表达式计算出更多有意义的数据。如下:
为查询结果指定别名:
看到上图,表达式已经很长了,可以为查询结果指定别名,SQL如下:
select column [as] alias_name [...] from table_name;
比如查询成绩表中的数据时,将每条记录中的三科成绩相加,然后将计算结果对应的列指定别名为“总分”。如下:
结果去重:
查询成绩表时指定查询数学成绩对应的列,可以看到数学成绩中有重复的分数。如下:
如果想要对查询结果进行去重操作,可以在SQL中的select后面带上distinct。如下:
3.2 where 条件
- 如果在查询数据时没有指定where子句,那么会直接将表中所有的记录作为数据源来依次执行select语句。
- 如果在查询数据时指定了where子句,那么在查询数据时会先根据where子句筛选出符合条件的记录,然后将符合条件的记录作为数据源来依次执行select语句。
where子句中可以指明一个或多个筛选条件,各个筛选条件之间用逻辑运算符and或or进行关联,下面给出了where子句中常用的比较运算符和逻辑运算符。
3.2.1 MySQL运算符
比较运算符:
运算符 | 说明 |
---|---|
>、>=、<、<= | 大于、大于等于、小于、小于等于 |
= | 等于。NULL不安全,例如NULL=NULL的结果是NULL而不是TRUE(1) |
<=> | 等于。NULL安全,例如NULL<=>NULL的结果就是TRUE(1) |
!=、<> | 不等于 |
between a0 and a1 | 范围匹配。如果a0<=value<=a1,则返回TRUE(1) |
in(option1, option2, …) | 如果是IN中的任意一个option,则返回TRUE(1) |
is NULL | 如果是NULL,则返回TRUE(1) |
in not NULL | 如果不是NULL,则返回TRUE(1) |
like | 模糊匹配。% 表示任意多个字符(包括0个),_ 表示任意一个字符 |
逻辑运算符:
运算符 | 说明 |
---|---|
and | 多个条件同时为TRUE(1),则结果为TRUE(1),否则为FALSE(0) |
or | 任意一个条件为TRUE(1),则结果为TRUE(1),否则为FALSE(0) |
not | 条件为TRUE(1),则结果为FALSE(0);条件为FALSE(0),则结果为TRUE(1) |
where 条件演示:
查询英语不及格的同学及其英语成绩:
在where子句中指明筛选条件为英语成绩小于60,在select的column列表中指明要查询的列为姓名和英语成绩。如下:
查询语文成绩在80到90分的同学及其语文成绩:
在where子句中指明筛选条件为语文成绩大于等于80并且小于等于90,在select的column列表中指明要查询的列为姓名和语文成绩。如下:
此外,这里也可以使用between a0 and a1来指明语文成绩的的所在区间。如下:
左闭右闭:
分别查询姓孙的同学和孙某同学:
查询姓孙的同学:在where子句中通过模糊匹配来判断当前同学是否姓孙(需要用到%来匹配多个字符),在select的column列表中指明要查询的列为姓名。如下:
查询孙某同学:在where子句中通过模糊匹配来判断当前同学是否为孙某(需要用到_来严格匹配单个字符,一个下划线一个字符),在select的column列表中指明要查询的列为姓名。如下:
查询语文成绩好于英语成绩的同学:在where子句中指明筛选条件为语文成绩大于英语成绩,在select的column列表中指明要查询的列为姓名、语文成绩和英语成绩。如下:
查询总成绩在200分以下的同学:在select的column列表中添加表达式查询,查询的表达式为语文、数学和英语成绩之和,为了方便观察可以将表达式对应的列指定别名为“总分”,在where子句中指明筛选条件为三科成绩之和小于200。如下:
需要注意的是,在where子句中不能使用select中指定的别名:
- 查询数据时是先根据where子句筛选出符合条件的记录。
- 然后再将符合条件的记录作为数据源来依次执行select语句。
也就是说,where子句的执行是先于select语句的,所以在where子句中不能使用别名,如果在where子句中使用别名,那么在查询数据时就会产生报错。如下:
查询性孙的同学,或总成绩大于200分并且语文成绩小于数学成绩并且英语成绩大于80分的同学,查询时需要用到模糊匹配、表达式查询和逻辑运算符。如下:
3.2.2 NULL的查询
这里用之前演示新增数据的学生表来演示NULL查询,学生表中的内容如下:
查询QQ号已知的同学:在where子句中指明筛选条件为QQ号不为NULL,在select的column列表中指明要查询的列为姓名和QQ号。如下:
查询QQ号未知的同学:在where子句中指明筛选条件为QQ号为NULL,在select的column列表中指明要查询的列为姓名和QQ号。如下:
需要注意的是,在与NULL值作比较的时候应该使用<=>运算符或者用is null,使用=运算符无法得到正确的查询结果。如下:
因为=运算符是NULL不安全的,使用=运算符将任何值与NULL作比较,得到的结果都是NULL。如下:
但是<=>运算符是NULL安全的,使用<=>运算符将NULL和NULL作比较得到的结果为TRUE(1),将非NULL值与NULL作比较得到的结果为FALSE(0)。如下:
3.3 order by 结果排序
结果排序的SQL如下:
select ... from table_name [where ...] order by column [asc | desc] [, ...];
- [ ]中代表的是可选项, 可以不加。
- asc 和desc 分别代表的是排升序和排降序,默认为 asc(不建议使用默认的,可读性不好)。
注意: 如果查询SQL中没有order by子句,那么返回的顺序是未定义的。
下面用前面建的exam_result表演示。
查询同学及其数学成绩,按数学成绩升序显示:在select的column列表中指明要查询的列为姓名和数学成绩,在order by子句中指明按照数学成绩进行升序排序。如下:
在students表查询同学及其QQ号,按QQ号升序显示(演示默认升序):在select的column列表中指明要查询的列为姓名和QQ号,在order by子句中指明按照QQ号进行升序排序。如下:
NULL值视为比任何值都小,因此排升序时出现在最上面。
查询同学的各门成绩,依次按数学降序、英语升序、语文升序显示:在select的column列表中指明要查询的列为姓名和QQ号,在order by子句中指明按照QQ号进行降序排序。如下:
查询同学的各门成绩,依次按数学降序、英语升序、语文升序显示:在select的column列表中指明要查询的列为姓名、数学成绩、英语成绩和语文成绩,在order by子句中指明依次按照数学成绩排降序、英语成绩排升序和语文成绩排升序。如下:
可以看到显示结果是按照数学成绩进行降序排序的,而相同的数学成绩之间则是按照英语成绩进行升序排序的。
- order by子句中可以指明按照多个字段进行排序,每个字段都可以指明按照升序或降序进行排序,各个字段之间使用逗号隔开,排序优先级与书写顺序相同。
- 比如上述SQL中,当两条记录的数学成绩相同时就会按照英语成绩进行排序,如果这两条记录的英语成绩也相同就会继续按照语文成绩进行排序,以此类推。
查询同学及其总分,按总分降序显示:在select的column列表中指明要查询的列为姓名和总分(表达式查询),在order by子句中指明按照总分进行降序排序。如下:
需要注意的是,在order by子句中可以使用select中指定的别名:
- 查询数据时是先根据where子句筛选出符合条件的记录。
- 然后再将符合条件的记录作为数据源来依次执行select语句。
- 最后再通过order by子句对select语句的执行结果进行排序。
也就是说,order by子句的执行是在select语句之后的,所以在order by子句中可以使用别名。如下:
查询姓孙的同学或姓曹的同学及其数学成绩,按数学成绩降序显示:
- 题目的前半句描述的是查询,后半句描述的是排序。
- 在排序的时候必须要有数据,因此可以先完成前面的查询动作,然后再根据题目要求进行排序。
查询数据时,在where子句中指明筛选条件为姓孙或姓曹(模糊匹配),在select的column列表中指明要查询的列为姓名和数学成绩。如下:
当查询到目标数据后再在查询SQL后添加order by子句,在order by子句中指明按照数学成绩进行降序排序。如下:
3.4 limit 筛选分页结果
从第0条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit n;
从第s条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit s, n;
从第s条记录开始,向后筛选出n条记录:
select ... from table_name [where ...] [order by ...] limit n, offset s;
- [ ]中代表的是可选项,可以不加。
- 查询SQL中各语句的执行顺序为:where、select、order by、limit。
- limit子句在筛选记录时,记录的下标从0开始。
建议: 对未知表进行查询时最好在查询SQL后加上limit 1,避免在查询全表数据时因为表中数据过大而导致数据库卡死。
按id进行分页,每页3条记录,分别显示第1、2、3页:这里使用成绩表中的数据来演示分页查询,查询第1页记录时在查询全表数据的SQL后,加上limit子句指明从第0条记录开始,向后筛选出3条记录。如下(最上面和最下面是无关演示):
查询第2页记录时在查询全表数据的SQL后,加上limit子句指明从第3条记录开始,向后筛选出3条记录。如下:
查询第3页记录时在查询全表数据的SQL后,加上limit子句指明从第6条记录开始,向后筛选出3条记录。如下:
说明一下: 如果从表中筛选出的记录不足n个,则筛选出几个就显示几个。
4. Update 修改
修改数据的SQL如下:
update table_name set column1=expr1 [, column2=expr2] ... [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL中的column=expr,表示将记录中列名为column的值修改为expr。
- 在修改数据之前需要先找到待修改的记录,update语句中的where、order by和limit就是用来定位数据的。
将孙悟空同学的数学成绩修改为80分:在修改数据之前,先查看孙悟空同学当前的数学成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩改为80分,并在修改后再次查看数据确保数据成功被修改。如下:
将曹孟德同学的数学成绩修改为60分,语文成绩修改为70分:在修改数据之前,先查看曹孟德同学当前的数学成绩和语文成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩改为60分,语文成绩改为70分,并在修改后再次查看数据确保数据成功被修改。如下:
将总成绩倒数前三的3位同学的数学成绩加上30分:在修改数据之前,先查看总成绩倒数前三的3位同学的数学成绩。如下:
在update语句中指明要将筛选出来的记录的数学成绩加上30分,并在修改后再次查看数据确保数据成功被修改。如下:
需要注意的是,MySQL中不支持+=这种复合赋值运算符,此外,这里在查看更新后的数据时不能查看总成绩倒数前三的3位同学,因为之前总成绩倒数前三的3位同学,数学成绩加上30分后可能就不再是倒数前三了。如下:
将所有同学的语文成绩修改为原来的2倍:在修改数据之前,先查看所有同学的语文成绩。如下:
在update语句中指明要将筛选出来的记录的语文成绩变为原来的2倍,并在修改后再次查看数据确保数据成功被修改。如下:
注意: 更新全表的语句要慎用,因为和下面的删除类似,更新了,原有的数据就找不回来了。
5. Delete 删除
5.1 delete 删除数据
删除数据的SQL如下:
delete from table_name [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- 在删除数据之前需要先找到待删除的记录,delete语句中的where、order by和limit就是用来定位数据的。
删除孙悟空同学的考试成绩:在删除数据之前,先查看孙悟空同学的相关信息,然后在delete语句中指明删除孙悟空对应的记录,并在删除后再次查看数据确保数据成功被删除。如下:
演示删除整张表数据:创建一张测试表,表中包含一个自增长的主键id和姓名。如下:
向表中插入一些测试数据用于删除。如下:
在delete语句中只指明要删除数据的表名,而不通过where、order by和limit指明筛选条件,这时将会删除整张表的数据。如下:
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是在之前的基础上继续增长的。如下:
查看创建表时的相关信息时可以看到,有一个AUTO_INCREMENT=n的字段,该字段表示下一次插入数据时自增长字段的值应该为n。如下:
当通过delete语句删除整表数据时,不会重置AUTO_INCREMENT=n字段,因此删除整表数据后插入数据对应的自增长id值会在原来的基础上继续增长。如下:
注意: 删除整表操作要慎用。
5.2 truncate 截断表
截断表的SQL如下:
truncate [table] table_name;
- [ ]中代表的是可选项,可不加。
- truncate只能对整表操作,不能像delete一样针对部分数据操作。
- truncate实际上不对数据操作,所以比delete更快。
- truncate在删除数据时不经过真正的事务,所以无法回滚。
- truncate会重置自增长AUTO_INCREMENT=n字段。
创建一张测试表,表中包含一个自增长的主键id和姓名。如下:
向表中插入一些测试数据用于删除。如下:
在truncate语句中只指明要删除数据的表名,这时便会删除整张表的数据,但由于truncate实际不对数据操作,因此执行truncate语句后看到影响行数为0。如下:
再向表中插入一些数据,在插入数据时不指明自增长字段的值,这时会发现插入数据对应的自增长id值是重新从1开始增长的。如下:
查看创建表时的相关信息时也可以看到,有一个AUTO_INCREMENT=n的字段,该字段表示下一次插入数据时自增长字段的值应该为n。如下:
但是当通过truncate语句删除整表数据时,会重置AUTO_INCREMENT字段,因此截断表后插入数据对应的自增长id值会重新从1开始增长。如下:
注意: 截断表操作要慎用。
6. 插入查询结果
插入查询结果的SQL如下:
insert [into] table_name [(column1 [, column2] ...)] select ... [where ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL的作用是将筛选出来的记录插入到指定的表当中。
- SQL中的column,表示将筛选出的记录的各个列插入到表中的哪一列。
删除表中重复的记录,重复的数据只能有一份:
创建一张测试表,表中包含id和姓名。如下:
向测试表中插入一些测试数据,数据中存在重复的记录。如下:
现在要求删除测试表中重复的数据,思路如下:
- 创建一张临时表,该表的结构与测试表的结构相同。
- 以去重的方式查询测试表中的数据,并将查询结果插入到临时表中。
- 将测试表重命名为其他名字,再将临时表重命名为测试表的名字,实现原子去重操作。
通过插入查询语句将去重查询后的结果插入到临时表中,由于临时表和测试表的结构相同,并且select进行的是全列查询,因此在插入时不用在表名后指明column列表。如下:
将测试表重命名为其他名字(相当于对去重前的数据进行备份,如果不需要可以直接删除),将临时表重命名为测试表的名字,这时便完成了表中数据的去重操作。如下:
7. 聚合函数
聚合函数对一组值执行计算并返回单一的值,常用的聚合函数如下:
函数 | 说明 |
---|---|
count([distinct] expr) | 返回查询到的数据的数量 |
sum([distinct] expr) | 返回查询到的数据的总和,不是数字没有意义 |
avg([distinct] expr) | 返回查询到的数据的平均值,不是数字没有意义 |
max([distinct] expr) | 返回查询到的数据的最大值,不是数字没有意义 |
min([distinct] expr) | 返回查询到的数据的最小值,不是数字没有意义 |
聚合函数可以在select语句中使用,此时select每处理一条记录时都会将对应的参数传递给这些聚合函数。
这里用之前的学生表来进行演示,学生表中的内容如下:
统计班级共有多少同学:在select语句中使用count函数,并将*作为参数传递给count函数,这时便能统计出表中的记录条数。如下:
这种写法相当于在查询表中数据时,自行新增了一列列名为特定表达式的列,我们就是在用count函数统计该列中有多少个数据,等价于统计表中有多少条记录。如下:
统计班级收集的QQ号有多少个:在select语句中使用count函数统计qq列中数据的个数,这时便能统计出表中QQ号的个数。如下:
如果count函数的参数是一个确定的列名,那么count函数将会忽略该列中的NULL值。
下面用之前的成绩表来进行演示,成绩表中的内容如下:
统计本次考试数学成绩的分数个数:在select语句中使用count函数统计math列中数据的个数,这时便能统计出表中的数学成绩的个数。如下:
为了方便演示,修改一下成绩表:
统计本次考试数学成绩的分数个数(去重):在使用count函数时(包括其他聚合函数),在传递的参数之前加上distinct,这时便能统计出表中数学成绩去重后的个数。如下:
统计数学成绩总分:在select语句中使用sum函数统计math列中数据的总和,这时便能统计出表中的数学成绩的总和。如下:
统计平均总分:在select语句中使用avg函数计算总分的平均值。如下:
返回数学最高分:在select语句中使用max函数查询数学成绩最高分。如下:
返回70分以上的英语最低分:在where子句中指明筛选条件为英语成绩大于70分,在select语句中使用min函数查询英语成绩最低分。如下:
8. group by 分组查询
分组查询测试表:直接复制的一份雇员信息表
雇员信息表中包含三张表,分别是员工表(emp)、部门表(dept)和工资等级表(salgrade)。
员工表(emp)中包含如下字段:
- 雇员编号(empno)。
- 雇员姓名(ename)。
- 雇员职位(job)。
- 雇员领导编号(mgr)。
- 雇佣时间(hiredate)。
- 工资月薪(sal)。
- 奖金(comm)。
- 部门编号(deptno)。
部门表(dept)中包含如下字段:
- 部门编号(deptno)。
- 部门名称(dname)。
- 部门所在地点(loc)。
工资等级表(salgrade)中包含如下字段:
- 等级(grade)。
- 此等级最低工资(losal)。
- 此等级最高工资(hisal)。
雇员信息表的SQL如下(复制粘贴即可):
DROP database IF EXISTS `scott`;
CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
USE `scott`;
DROP TABLE IF EXISTS `dept`;
CREATE TABLE `dept` (
`deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号',
`dname` varchar(14) DEFAULT NULL COMMENT '部门名称',
`loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点'
);
DROP TABLE IF EXISTS `emp`;
CREATE TABLE `emp` (
`empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号',
`ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名',
`job` varchar(9) DEFAULT NULL COMMENT '雇员职位',
`mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号',
`hiredate` datetime DEFAULT NULL COMMENT '雇佣时间',
`sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪',
`comm` decimal(7,2) DEFAULT NULL COMMENT '奖金',
`deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号'
);
DROP TABLE IF EXISTS `salgrade`;
CREATE TABLE `salgrade` (
`grade` int(11) DEFAULT NULL COMMENT '等级',
`losal` int(11) DEFAULT NULL COMMENT '此等级最低工资',
`hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资'
);
insert into dept (deptno, dname, loc)
values (10, 'ACCOUNTING', 'NEW YORK');
insert into dept (deptno, dname, loc)
values (20, 'RESEARCH', 'DALLAS');
insert into dept (deptno, dname, loc)
values (30, 'SALES', 'CHICAGO');
insert into dept (deptno, dname, loc)
values (40, 'OPERATIONS', 'BOSTON');
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20);
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno)
values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10);
insert into salgrade (grade, losal, hisal) values (1, 700, 1200);
insert into salgrade (grade, losal, hisal) values (2, 1201, 1400);
insert into salgrade (grade, losal, hisal) values (3, 1401, 2000);
insert into salgrade (grade, losal, hisal) values (4, 2001, 3000);
insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
上述SQL中创建了一个名为scott的数据库,在该数据库中分别创建了部门表(dept)、员工表(emp)和工资等级表(salgrade),并分别向三张表中插入了一些数据用于查询。
执行完文件中的SQL后查看数据库,就能看到多了一个名为scott的数据库。如下:
进入该数据库,在该数据库中就可以看到雇员信息表中的三张表。如下:
其中部门表(dept)的表结构和表中的内容如下:
员工表(emp)的表结构和表中的内容如下:
工资等级表(salgrade)的表结构和表中的内容如下:
8.1 group by 测试
上面是测试表,分组查询的SQL如下:
select column1 [, column2], ... from table_name [where ...] group by column [, ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- 查询SQL中各语句的执行顺序为:where、group by、select、order by、limit。
- group by后面的列名,表示按照指定列进行分组查询。
测试演示:显示每个部门的平均工资和最高工资:
在group by子句中指明按照部门号进行分组,在select语句中使用avg函数和max函数,分别查询每个部门的平均工资和最高工资。如下:
测试演示:显示每个部门的每种岗位的平均工资和最低工资:
在group by子句中指明依次按照部门号和岗位进行分组,在select语句中使用avg函数和min函数,分别查询每个部门的每种岗位的平均工资和最低工资。如下:
- group by子句中可以指明按照多个字段进行分组,各个字段之间使用逗号隔开,分组优先级与书写顺序相同。
- 比如上述SQL中,当两条记录的部门号相同时,将会继续按照岗位进行分组。
8.2 having 条件
含有having子句的SQL如下:
select ... from table_name [where ...] group by ... [having ...] [order by ...] [limit ...];
- [ ]中代表的是可选项,可不加。
- SQL中各语句的执行顺序为:where、group by、select、having、order by、limit。
- having子句中可以指明一个或多个筛选条件。
having子句和where子句的区别
- where子句放在表名后面,而having子句必须搭配group by子句使用,放在group by子句的后面。
- where子句是对整表的数据进行筛选,having子句是对分组后的数据进行筛选。
- where子句中不能使用聚合函数和别名,而having子句中可以使用聚合函数和别名。
测试演示:显示平均工资低于2000的部门和它的平均工资:
- 先统计每个部门的平均工资。
- 然后通过having子句筛选出平均工资低于2000的部门。
在group by子句中指明按照部门号进行分组,在select语句中使用avg函数查询每个部门的平均工资。然后在having子句中指明筛选条件为平均工资小于2000。如下:
本篇完。
再贴一个前面贴过的有用的面试题:SQL查询中各个关键字的执行先后顺序: from > on> join > where > group by > with > having > select > distinct > order by > limit
下一部分是内置函数和复合查询的学习。