本笔记为阿里云天池龙珠计划SQL训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql;
1、基础查询
SELECT <列名>, FROM <表名>;
SELECT <列名>, …… FROM <表名> WHERE <条件表达式>;
其中规则如下:
- 星号(*)代表全部列的意思。
- SQL中可以随意使用换行符,不影响语句执行(但不可插入空行)。
- 设定汉语别名时需要使用双引号(")括起来。
- 在SELECT语句中使用DISTINCT可以删除重复行。
- 注释是SQL语句中用来标识说明或者注意事项的部分。分为1行注释"-- "和多行注释两种"/* */"。
2、运算符
主要涉及到算术运算符、比较运算符和逻辑运算符。
含义 | 运算符 |
---|---|
加法 | + |
减法 | - |
乘法 | * |
除法 | / |
运算符 | 含义 |
---|---|
= | 和~相等 |
<> | 和~不相等 |
>= | 大于等于~ |
> | 大于~ |
<= | 小于等于~ |
< | 小于~ |
其中规则如下:
- SELECT子句中可以使用常数或者表达式。
- 使用比较运算符时一定要注意不等号和等号的位置。
- 字符串类型的数据原则上按照字典顺序进行排序,不能与数字的大小顺序混淆。
- 希望选取NULL记录时,需要在条件表达式中使用IS NULL运算符。希望选取不是NULL的记录时,需要在条件表达式中使用IS NOT NULL运算符。
3、聚合查询
SQL中用于汇总的函数叫做聚合函数。以下五个是最常用的聚合函数:
- COUNT:计算表中的记录数(行数)
- SUM:计算表中数值列中数据的合计值
- AVG:计算表中数值列中数据的平均值
- MAX:求出表中任意列中数据的最大值
- MIN:求出表中任意列中数据的最小值
-- 计算全部数据的行数(包含NULL) SELECT COUNT(*) FROM <表名>;
-- 计算NULL以外数据的行数 SELECT COUNT(<列名>) FROM <表名>;
-- 计算<列名1>和<列名2>的合计值 SELECT SUM(<列名1>), SUM(<列名2>) FROM <表名>;
-- 计算<列名1>和<列名2>的平均值 SELECT AVG(<列名1>), AVG(<列名2>) FROM <表名>;
-- MAX和MIN也可用于非数值型数据 SELECT MAX(<列名3>), MIN(<列名3>) FROM product;
-- 计算去除重复数据后的数据行数 SELECT COUNT(DISTINCT <列名1>) FROM <表名>;
-- 是否使用DISTINCT时的动作差异(SUM函数) SELECT SUM(<列名1>), SUM(DISTINCT <列名1>) FROM <表名>;
其中规则如下:
- COUNT函数的结果根据参数的不同而不同。COUNT(*)会得到包含NULL的数据行数,而COUNT(<列名>)会得到NULL之外的数据行数。
- 聚合函数会将NULL排除在外。但COUNT(*)例外,并不会排除NULL。
- MAX/MIN函数几乎适用于所有数据类型的列。SUM/AVG函数只适用于数值类型的列。
- 想要计算值的种类时,可以在COUNT函数的参数中使用DISTINCT。
- 在聚合函数的参数中使用DISTINCT,可以删除重复数据。
4、分组查询
SELECT <列名1>,<列名2>, <列名3>, …… FROM <表名>
GROUP BY <列名1>, <列名2>, <列名3>, ……;
其中规则如下:
- 书写顺序**.**SELECT → 2. FROM → 3. WHERE → 4. GROUP BY。
- 在 GROUP BY 子句中指定的列称为聚合键或者分组列。
- 将NULL作为一组特殊数据处理。
常见错误:
- 在聚合函数的SELECT子句中写了聚合健以外的列——使用COUNT等聚合函数时,SELECT子句中如果出现列名,只能是GROUP BY子句中指定的列名(也就是聚合键)。
- 在GROUP BY子句中使用列的别名——SELECT子句中可以通过AS来指定别名,但在GROUP BY中不能使用别名。因为在DBMS中 ,SELECT子句在GROUP BY子句后执行。
- 在WHERE中使用聚合函数——原因是聚合函数的使用前提是结果集已经确定,而WHERE还处于确定结果集的过程中,所以相互矛盾会引发错误。 如果想指定条件,可以在SELECT,HAVING,以及ORDER BY子句中使用聚合函数。
5、HAVING
特点:HAVING子句用于对分组进行过滤,可以使用数字、聚合函数和GROUP BY中指定的列名(聚合键)。
6、ORDER BY
特点:SQL中的执行结果是随机排列的,当需要按照特定顺序排序时,可已使用ORDER BY子句。
SELECT <列名1>, <列名2>, <列名3>, …… FROM <表名> ORDER BY <排序基准列1>, <排序基准列2>, ……
其中默认为升序,DESC为降序,并且当用于排序的列名中含有NULL时,NULL会在开头或末尾进行汇总。
特别地:
GROUP BY 子句中不能使用SELECT 子句中定义的别名,但是在 ORDER BY 子句中却可以使用别名。因为SQL在使用 HAVING 子句时 SELECT 语句的执行****顺序为:
FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY