本笔记为阿里云天池龙珠计划SQL训练营的学习内容,链接为:https://tianchi.aliyun.com/specials/promotion/aicampsql
一、1、通过括号优先处理
如果要查找这样一个商品,该怎么处理?
“商品种类为办公用品”并且“登记日期是 2009 年 9 月 11 日或者 2009 年 9 月 20 日”
理想结果为“打孔器”,但当你输入以下信息时,会得到错误结果
-- 将查询条件原封不动地写入条件表达式,会得到错误结果
SELECT product_name, product_type, regist_date
FROM product
WHERE product_type = '办公用品'
AND regist_date = '2009-09-11'
OR regist_date = '2009-09-20';
错误的原因是是 AND 运算符优先于 OR 运算符,想要优先执行OR运算,可以使用括号:
-- 通过使用括号让OR运算符先于AND运算符执行
SELECT product_name, product_type, regist_date
FROM product
WHERE product_type = '办公用品'
AND ( regist_date = '2009-09-11'
OR regist_date = '2009-09-20');
二、练习题 第一部分
1、
select product_name,regist_date from product
where regist_date> '2009-04-28';
2、返回值为 空 空 空
3、
select product_name,product_type,(0.9*sale_price-purchase_price) as profit
from product
where (0.9*sale_price-purchase_price)>100
and (product_type='厨房用具' or product_type='办公用品');
三、聚集函数的注意点
- COUNT函数的结果根据参数的不同而不同。COUNT(*)*会得到包含NULL的数据行数,而COUNT(<列名>)会得到NULL之外的数据行数。
- 聚合函数会将NULL排除在外。但COUNT()例外,并不会排除NULL。
- MAX/MIN函数几乎适用于所有数据类型的列。SUM/AVG函数只适用于数值类型的列。
- 想要计算值的种类时,可以在COUNT函数的参数中使用DISTINCT。 在聚合函数的参数中使用DISTINCT,可以删除重复数据。
四、对表进行分组
一个很形象的比喻: GROUP BY 子句就像切蛋糕那样将表进行了分组。在 GROUP BY 子句中指定的列称为聚合键或者分组列
注意点:
- 当聚合建包含NULL时,会将NULL作为一组特殊数据进行处理。
- Group by 子句具有严格的执行顺序,否则无法正常执行。
书写顺序为:
1.SELECT → 2. FROM → 3. WHERE → 4. GROUP BY
其中前三项用于筛选数据,GROUP BY对筛选出的数据进行处理。
常见错误:
1、在聚合函数的SELECT子句中写了聚合健以外的列
使用COUNT等聚合函数时,SELECT子句中如果出现列名,只能是GROUP BY子句中指定的列名(也就是聚合键)。
2、 在GROUP BY子句中使用列的别名
SELECT子句中可以通过AS来指定别名,但在GROUP BY中不能使用别名。因为在DBMS中 ,SELECT子句在GROUP BY子句后执行。
3、、在WHERE中使用聚合函数
原因是聚合函数的使用前提是结果集已经确定,而WHERE还处于确定结果集的过程中,所以相互矛盾会引发错误。如果想指定条件,可以在SELECT,HAVING(下面马上会讲)以及ORDER BY子句中使用聚合函数。
五、为聚合函数指定条件
having函数可以得到特定的分组,注意这里不能使用where子句,因为where子句只能指定行的条件,而不能指定组的条件。
having的用法类似于where,可以在group by后使用having子句。
HAVING特点
HAVING子句用于对分组进行过滤,可以使用数字、聚合函数和GROUP BY中指定的列名(聚合键)。
-- 数字
SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type
HAVING COUNT(*) = 2;
-- 错误形式(因为product_name不包含在GROUP BY聚合键中)
SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type
HAVING product_name = '圆珠笔';
六、对查询结果进行排序
默认为升序排列,降序排列为DESC
-- 降序排列
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price DESC;
-- 多个排序键
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price, product_id;
-- 当用于排序的列名中含有NULL时,NULL会在开头或末尾进行汇总。
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY purchase_price;
Tips:2 ORDER BY中列名可使用别名
前文讲GROUP BY中提到,GROUP BY 子句中不能使用SELECT 子句中定义的别名,但是在 ORDER BY 子句中却可以使用别名。为什么在GROUP BY中不可以而在ORDER BY中可以呢?
这是因为SQL在使用 HAVING 子句时 SELECT 语句的执行****顺序为:
FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY
其中SELECT的执行顺序在 GROUP BY 子句之后,ORDER BY 子句之前。也就是说,当在ORDER BY中使用别名时,已经知道了SELECT设置的别名存在,但是在GROUP BY中使用别名时还不知道别名的存在,所以在ORDER BY中可以使用别名,但是在GROUP BY中不能使用别名****。
七、练习题 第二部分
练习题5:请指出下述SELECT语句中所有的语法错误。
SELECT product_id, SUM(product_name)
--本SELECT语句中存在错误。
FROM product
GROUP BY product_type
WHERE regist_date > '2009-09-01';
errors:
1、group by 中指定的分组字段与select 语句中的字段不同。
2、product_name为varchar类型,sum()函数只能对int型数据进行计算。
3、Group by 子句具有严格的执行顺序,否则无法正常执行
SELECT → 2. FROM → 3. WHERE → 4. GROUP BY
其中前三项用于筛选数据,GROUP BY对筛选出的数据进行处理
所以,修改为
SELECT product_type, SUM(purchase_price)
--本SELECT语句中存在错误。
FROM product
WHERE regist_date > '2009-09-01'
GROUP BY product_type;
另外,having子句是对group by分组后的结果进行过滤,而因为product_type不包含在GROUP BY聚合键中,所以形式错误。
:练习题6、请编写一条SELECT语句,求出销售单价(sale_price列)合计值大于进货单价(purchase_price列)合计值1.5倍的商品种类。执行结果如下所示
product_type | sum | sum
-------------+------+------
衣服 | 5000 | 3300
办公用品 | 600 | 320
sql语句如下:
select product_type,sum(sale_price) as sum,sum(purchase_price) as sum
from product
group by product_type
having sum(sale_price)>1.5*sum(purchase_price)
order by sum(sale_price) desc;
练习题7:
此前我们曾经使用SELECT语句选取出了product(商品)表中的全部记录。当时我们使用了ORDERBY子句来指定排列顺序,但现在已经无法记起当时如何指定的了。请根据下列执行结果,思考ORDERBY子句的内容。
思考:观察product表中的数值型数据后发现,只有regist_date是按一定的顺序排列的,按日期进行了降序排列,因此我们推断sql查询语句为:
select * from product
ORDER By regist_date desc;
这里有一个小问题,在依据regist_date的日期进行排序时,null值被排到了最后一行,而我们希望得到的结果是regist_date为null值的那一行记录在结果的最前面,搜索解决方法时,发现大部分博主都是给的isnull()函数解决,
ORDER BY
IF
( ISNULL( regist_date), 0, 1 ),
regist_date DESC
但是我在sql sever上执行时,报错为isnull有两个参数,不知道是方法的问题还是什么,如果读者找到了解决方案,欢迎在评论区留言或者给我私信!