本笔记为阿里云天池龙珠计划SQL训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql;
一、SELECT语句基础:
1.1 从表中选取数据
SELECT语句
通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。基本SELECT语句包含了SELECT和FROM两个子句(clause)。
1.2从表中选取符合条件的数据、
WHERE语句
SELECT 语句通过WHERE子句来指定查询数据的条件。
1.3 相关法则
(1)星号(*)代表全部列的意思。
(2)SQL中可以随意使用换行符,不影响语句执行(但不可插入空行)。
(3)设定汉语别名时需要使用双引号(")括起来。
(4)在SELECT语句中使用DISTINCT可以删除重复行。
(5)注释是SQL语句中用来标识说明或者注意事项的部分。分为1行注释"-- "和多行注释两种"/* */"。
二、算术运算符和比较运算符:
2.1 算术运算符
SQL语句中可以使用的四则运算的主要运算符如下:
含义 | 运算符 |
---|---|
加法 | + |
减法 | - |
乘法 | * |
除法 | / |
2.2 比较运算符
选取出sale_price列为500的记录
SQL常见比较运算符如下:
运算符 | 含义 |
---|---|
= | 和~相等 |
<> | 和~不相等 |
>= | 大于等于~ |
> | 大于~ |
<= | 小于等于~ |
< | 小于~ |
2.3 常用法则
(1)SELECT子句中可以使用常数或者表达式。
(2)使用比较运算符时一定要注意不等号和等号的位置。
(3)字符串类型的数据原则上按照字典顺序进行排序,不能与数字的大小顺序混淆。
(4)希望选取NULL记录时,需要在条件表达式中使用IS NULL运算符。希望选取不是NULL的记录时,需要在条件表达式中使用IS NOT NULL运算符。
三、逻辑运算符:
3.1 NOT运算符
想要表示“不是……”时,除了前文的<>运算符外,还存在另外一个表示否定、使用范围更广的运算符:NOT。
注:NOT不能单独使用
3.2 AND运算符和OR运算符
当希望同时使用多个查询条件时,可以使用AND或者OR运算符。
注:AND 相当于“并且”,类似数学中的取交集;OR 相当于“或者”,类似数学中的取并集。
3.3 通过括号优先处理
eg:AND运算符优先于OR运算符,想要优先执行OR运算,就需要使用括号。
3.4 真值表
当碰到条件较复杂的语句时,理解语句含义并不容易,这时可以采用真值表来梳理逻辑关系。
AND 运算符:两侧的真值都为真时返回真,除此之外都返回假。
OR 运算符:两侧的真值只要有一个不为假就返回真,只有当其两侧的真值都为假时才返回假。
NOT运算符:只是单纯的将真转换为假,将假转换为真。
真值表
3.5 含有NULL时的真值
NULL的真值结果既不为真,也不为假,因为并不知道这样一个值。这时真值是除真假之外的第三种值——不确定(UNKNOWN)。一般的逻辑运算并不存在这第三种值。SQL 之外的语言也基本上只使用真和假这两种真值。与通常的逻辑运算被称为二值逻辑相对,只有 SQL 中的逻辑运算被称为三值逻辑。
三值逻辑下的AND和OR真值表为:
四、对表进行聚合查询:
4.1 聚合函数
SQL中用于汇总的函数叫做聚合函数。以下五个是最常用的聚合函数:
(1)COUNT:计算表中的记录数(行数)
(2)SUM:计算表中数值列中数据的合计值
(3)AVG:计算表中数值列中数据的平均值
(4)MAX:求出表中任意列中数据的最大值
(5)MIN:求出表中任意列中数据的最小值
4.2 使用聚合函数删除重复值
4.3 常用法则
(1)COUNT函数的结果根据参数的不同而不同。COUNT(*)会得到包含NULL的数据行数,而COUNT(<列名>)会得到NULL之外的数据行数。
(2)聚合函数会将NULL排除在外。但COUNT(*)例外,并不会排除NULL。
(3)MAX/MIN函数几乎适用于所有数据类型的列。SUM/AVG函数只适用于数值类型的列。
(4)想要计算值的种类时,可以在COUNT函数的参数中使用DISTINCT。
(5)在聚合函数的参数中使用DISTINCT,可以删除重复数据。
五、对表进行分组:
5.1 GROUP BY语句
当你想将进行分组汇总时(即:将现有的数据按照某列来汇总统计),使用GROUP BY语句:
5.2 聚合键中包含NULL时
此时会将NULL作为一组特殊数据进行处理。
5.3 GROUP BY书写位置
GROUP BY的子句书写顺序有严格要求,不按要求会导致SQL无法正常执行,目前出现过的子句书写****顺序为:
1**.**SELECT → 2. FROM → 3. WHERE → 4. GROUP BY
其中前三项用于筛选数据,GROUP BY对筛选出的数据进行处理。
5.4 在WHERE子句中使用GROUP BY
5.5 常见错误
在使用聚合函数及GROUP BY子句时,经常出现的错误有:
(1)在聚合函数的SELECT子句中写了聚合健以外的列 使用COUNT等聚合函数时,SELECT子句中如果出现列名,只能是GROUP BY子句中指定的列名(也就是聚合键)。
(2)在GROUP BY子句中使用列的别名 SELECT子句中可以通过AS来指定别名,但在GROUP BY中不能使用别名。因为在DBMS中 ,SELECT子句在GROUP BY子句后执行。
(3)在WHERE中使用聚合函数 原因是聚合函数的使用前提是结果集已经确定,而WHERE还处于确定结果集的过程中,所以相互矛盾会引发错误。 如果想指定条件,可以在SELECT,HAVING(下面马上会讲)以及ORDER BY子句中使用聚合函数。
六、为聚合结果指定条件:
6.1 用HAVING得到特定分组
可以在GROUP BY后使用HAVING子句。HAVING的用法类似WHERE。
6.2 HAVING特点
HAVING子句用于对分组进行过滤,可以使用数字、聚合函数和GROUP BY中指定的列名(聚合键)。
七、对查询结果进行排序:
7.1 ORDER BY
SQL中的执行结果是随机排列的,当需要按照特定顺序排序时,可已使用ORDER BY子句。
默认为升序排列(ASC),降序排列为DESC
7.2 ORDER BY中列名可使用别名
前文讲GROUP BY中提到,GROUP BY 子句中不能使用SELECT 子句中定义的别名,但是在 ORDER BY 子句中却可以使用别名。为什么在GROUP BY中不可以而在ORDER BY中可以呢?
这是因为SQL在使用 HAVING 子句时 SELECT 语句的执行****顺序为:
FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY
其中SELECT的执行顺序在 GROUP BY 子句之后,ORDER BY 子句之前。也就是说,当在ORDER BY中使用别名时,已经知道了SELECT设置的别名存在,但是在GROUP BY中使用别名时还不知道别名的存在,所以在ORDER BY中可以使用别名,但是在GROUP BY中不能使用别名****。
八、练习:
8.1第一部分
练习题1
编写一条SQL语句,从product(商品)表中选取出“登记日期(regist在2009年4月28日之后”的商品,查询结果要包含product_name和regist_date两列。
代码实现:
练习题2
请说出对product 表执行如下3条SELECT语句时的返回结果。
①
SELECT *
FROM product
WHERE purchase_price = NULL;
②
SELECT *
FROM product
WHERE purchase_price <> NULL;
③
SELECT *
FROM product
WHERE product_name > NULL;
答:三个返回结果均为空。
练习题3
代码清单2-22(2-2节)中的SELECT语句能够从product表中取出“销售单价(saleprice)比进货单价(purchase price)高出500日元以上”的商品。请写出两条可以得到相同结果的SELECT语句。执行结果如下所示。
product_name | sale_price | purchase_price
-------------+------------+------------
T恤衫 | 1000 | 500
运动T恤 | 4000 | 2800
高压锅 | 6800 | 5000
代码实现:
练习题4
请写出一条SELECT语句,从product表中选取出满足“销售单价打九折之后利润高于100日元的办公用品和厨房用具”条件的记录。查询结果要包括product_name列、product_type列以及销售单价打九折之后的利润(别名设定为profit)。
提示:销售单价打九折,可以通过saleprice列的值乘以0.9获得,利润可以通过该值减去purchase_price列的值获得。
代码实现:
8.2第二部分
练习题5
请指出下述SELECT语句中所有的语法错误。
SELECT product_id, SUM(product_name)
--本SELECT语句中存在错误。
FROM product
GROUP BY product_type
WHERE regist_date > '2009-09-01';
答:1.sum()不用用于字符串类型数值。
2.SELECT子句没有包含GROUP BY 列
3.WHERE应该在FROM 后 GROUP BY 前。
练习题6
请编写一条SELECT语句,求出销售单价(sale_price列)合计值大于进货单价(purchase_price列)合计值1.5倍的商品种类。执行结果如下所示。
product_type | sum | sum
-------------+------+------
衣服 | 5000 | 3300
办公用品 | 600 | 320
代码实现:
练习题7
此前我们曾经使用SELECT语句选取出了product(商品)表中的全部记录。当时我们使用了ORDERBY子句来指定排列顺序,但现在已经无法记起当时如何指定的了。请根据下列执行结果,思考ORDERBY子句的内容。
代码实现: