Task02-MySQL基础学习之查询与排序

1 SELECT语句基础

1.1 从表中选出数据

  • 从表中选取数据时需要使用SELECT语句,也就是只从表中选出(SELECT)必要数据的意思。通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。
  • 基本SELECT语句包含了SELECT和FROM两个子句(clause)。示例如下:
SELECT <列名> FROM <表名>;

【注意】:
1.关键字SELECT和FROM最好大写。
2.每个单词之间用空格隔开,若为多列则多列之间采用逗号隔开,且在查询语句的最后添加“;”。
3.为便于清晰查看查询语句的结构,可以将每一个关键字作为一行,如下所示:

SELECT <列名>,<列名>
FROM <表名>;

1.2 从表中选出符合条件的数据

  • 当需要筛选符合条件的语句时,比如选取出满足“商品种类为衣服”“销售单价在1000日元以上”这些条件的数据时,需要使用WHERE关键字。
  • SELECT 语句通过WHERE子句来指定查询数据的条件。在WHERE 子句中可以指定“某一列的值和这个字符串相等”或者“某一列的值大于这个数字”等条件。执行含有这些条件的SELECT语句,就可以查询出只符合该条件的记录了。

查询的语法为:

SELECT <列名>,……
FROM <表名>
WHERE <条件表达式>;

举个例子:

-- 用来选取product type列为衣服的记录的SELECT语句
SELECT product_name,product_type
FROM product
WHERE product_type = '衣服';

在这里插入图片描述

-- 也可以选取出不是查询条件的列(条件列与输出列不同)
SELECT product_name
FROM product
WHERE product_type = '衣服';

在这里插入图片描述

1.3 相关法则

  • 星号(*)代表全部列的意思。

举个例子:

SELECT *
FROM product
WHERE product_type = '衣服';

运行结果:
在这里插入图片描述可以看到结果里将表格中所有的列都查询出来。

  • SQL中可以随意使用换行符,不影响语句执行(但不可插入空行)。
  • 设定汉语别名时需要使用双引号(")括起来。
-- SQL语句可以使用AS关键字为列设定别名(用中文时需要双引号(“”))。
SELECT product_id     As id,
       product_name   As name,
       purchase_price AS "进货单价"
FROM product;
  • 在SELECT语句中使用DISTINCT可以删除重复行。

这里需要注意一下!
DISTINCT后面可以跟多个列,如果跟多个列,则多个列内容相同时才会被认为是重复。 举个例子:
原始数据:
在这里插入图片描述

SELECT DISTINCT product_type
FROM product;

运行结果:
在这里插入图片描述
可以看到此时product_type中重复的都被删除。
而当DISTINCT后面跟多个列时:

SELECT DISTINCT product_type,product_name
FROM product;

运行结果:
在这里插入图片描述

  • 注释是SQL语句中用来标识说明或者注意事项的部分。分为1行注释"-- “和多行注释两种”/* */"。

2 算术运算符和比较运算符

2.1 算数运算符

  • SQL语句中可以使用的四则运算的主要运算符如下:
含义运算符
加法+
减法-
乘法*
除法/

2.2 比较运算符

SQL常见比较运算符如下:

含义运算符
相等=
不相等<>
大于等于>=
大于>
小于等于<=
小于<

举个例子:

-- 选取出sale_price列为500的记录
SELECT product_name,product_type
FROM product
WHERE sale_price = 500

运行结果:
在这里插入图片描述

2.3 常用法则

  • SELECT子句中可以使用常数或者表达式。

举个例子:

-- SQL语句中也可以使用运算表达式
SELECT product_name,sale_price,sale_price * 2 AS "sale_price x2"
FROM product;

运行结果:

-- WHERE子句的条件表达式中也可以使用计算表达式
SELECT product_name,sale_price,purchase_price
FROM product
WHERE sale_price-purchase_price >= 500;

运行结果:
在这里插入图片描述

  • 使用比较运算符时一定要注意不等号和等号的位置。
  • 字符串类型的数据原则上按照字典顺序进行排序,不能与数字的大小顺序混淆。
  • 希望选取NULL记录时,需要在条件表达式中使用IS NULL运算符。希望
  • 取不是NULL的记录时,需要在条件表达式中使用IS NOT NULL运算符。

举个例子:

-- 选取NULL的记录
SELECT product_name,purchase_price
FROM product
WHERE purchase_price IS NULL;
-- 选取不为NULL的记录
SELECT product_name,purchase_price
FROM product
WHERE purchase_price IS NOT NULL;

3 逻辑运算符

3.1 NOT运算符

  • 想要表示“不是……”时,除了前文的<>运算符外,还存在另外一个表示否定、使用范围更广的运算符:NOT。

NOT不能单独使用,注意NOT在语句中的位置。举个小例子:

-- 选取出销售单价大于等于1000日元的记录
SELECT product_name,product_type,sale_price
FROM product
WHERE sale_price >= 1000;
-- 向代码清单2-30的查询条件中添加NOT运算符
SELECT product_name,product_type,sale_price
FROM product
WHERE NOT sale_price >= 1000;

3.2 AND运算符和OR运算符

  • 当希望同时使用多个查询条件时,可以使用AND或者OR运算符。AND 相当于“并且”,类似数学中的取交集;OR 相当于“或者”,类似数学中的取并集。

如下图所示:
AND运算符工作效果图
AND运算符工作效果图
OR运算符工作效果图
在这里插入图片描述
【举个容易出错的例子!!】

“商品种类为办公用品”并且“登记日期是 2009 年 9 月 11 日或者 2009 年 9 月 20 日”,理想结果为“打孔器”,但当你输入以下信息时,会得到错误结果。

-- 将查询条件原封不动地写入条件表达式,会得到错误结果
SELECT product_name, product_type, regist_date
FROM product
WHERE product_type = '办公用品'
AND regist_date = '2009-09-11'
OR regist_date = '2009-09-20';

运行结果:
在这里插入图片描述
错误原因在于,AND 运算符优先于 OR 运算符,因此相当于选出的商品为“类型为办公用品且登记日期为2009年9月11日”或“登记日期为2009年9月20日”的商品。

想要优先执行OR运算,可以使用括号:

-- 通过使用括号让OR运算符先于AND运算符执行
SELECT product_name, product_type, regist_date
FROM product
WHERE product_type = '办公用品'
AND ( regist_date = '2009-09-11'
OR regist_date = '2009-09-20');

运行结果:
在这里插入图片描述

3.3 真值表

  • 复杂运算时该怎样理解?当碰到条件较复杂的语句时,理解语句含义并不容易,这时可以采用真值表来梳理逻辑关系。

什么是真值

  • 本节介绍的三个运算符 NOT、AND 和 OR 称为逻辑运算符。这里所说的逻辑就是对真值进行操作的意思。真值就是值为真(TRUE)或假 (FALSE)其中之一的值。
  • 例如,对于 sale_price >= 3000 这个查询条件来说,由于 product_name 列为 ‘运动 T 恤’ 的记录的 sale_price 列的值是 2800,因此会返回假(FALSE),而 product_name 列为 ‘高压锅’ 的记录的sale_price 列的值是 5000,所以返回真(TRUE)。
  • AND 运算符两侧的真值都为真时返回真,除此之外都返回假。
  • OR 运算符两侧的真值只要有一个不为假就返回真,只有当其两侧的真值都为假时才返回假。
  • NOT运算符只是单纯的将真转换为假,将假转换为真。

真值表
在这里插入图片描述
查询条件为P AND(Q OR R)的真值表
在这里插入图片描述
【注意】含有NULL时的真值

  • NULL的真值结果既不为真,也不为假,因为并不知道这样一个值。
    那该如何表示呢?这时真值是除真假之外的第三种值——不确定(UNKNOWN)。一般的逻辑运算并不存在这第三种值。SQL 之外的语言也基本上只使用真和假这两种真值。与通常的逻辑运算被称为二值逻辑相对,只有 SQL 中的逻辑运算被称为三值逻辑。三值逻辑下的AND和OR真值表为:
    在这里插入图片描述

4 对表进行聚合查询

4.1 常用聚合函数

SQL中用于汇总的函数叫做聚合函数。以下五个是最常用的聚合函数:

  • COUNT:计算表中的记录数(行数)
  • SUM:计算表中数值列中数据的合计值
  • AVG:计算表中数值列中数据的平均值
  • MAX:求出表中任意列中数据的最大值
  • MIN:求出表中任意列中数据的最小值
-- 计算全部数据的行数(包含NULL)
SELECT COUNT(*)
FROM product;
-- 计算NULL以外数据的行数
SELECT COUNT(purchase_price)
FROM product;
-- 计算销售单价和进货单价的合计值
SELECT SUM(sale_price), SUM(purchase_price) 
FROM product;
-- 计算销售单价和进货单价的平均值
SELECT AVG(sale_price), AVG(purchase_price)
FROM product;
-- MAX和MIN也可用于非数值型数据
SELECT MAX(regist_date), MIN(regist_date)
FROM product;

4.2 常用法则

  • COUNT函数的结果根据参数的不同而不同。COUNT(*)会得到包含NULL的数据行数,而COUNT(<列名>)会得到NULL之外的数据行数。
  • 聚合函数会将NULL排除在外。但COUNT(*)例外,并不会排除NULL。
  • MAX/MIN函数几乎适用于所有数据类型的列。SUM/AVG函数只适用于数值类型的列。
  • 想要计算值的种类时,可以在COUNT函数的参数中使用DISTINCT。
  • 在聚合函数的参数中使用DISTINCT,可以删除重复数据。

5 对表进行分组

5.1 GROUP BY语句

  • 上述提到的使用聚合函数会将整个表的数据进行处理,如果需要对数据进行分组汇总时(即:将现有的数据按照某列来汇总统计),可以使用GROUP BY语句,语法如下:
SELECT <列名1>,<列名2>, <列名3>, ……
FROM <表名>
GROUP BY <列名1>, <列名2>, <列名3>, ……;

举个例子:

-- 按照商品种类统计数据行数
SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type;

运行结果:
在这里插入图片描述
按照商品种类对表进行切分在这里插入图片描述
GROUP BY 子句就像切蛋糕那样将表进行了分组。在 GROUP BY 子句中指定的列称为聚合键或者分组列

GROUP BY书写位置

  • GROUP BY的子句书写顺序有严格要求,不按要求会导致SQL无法正常执行,目前出现过的子句顺序为:
    1.SELECT → 2. FROM → 3. WHERE → 4. GROUP BY,其中前三项用于筛选数据,GROUP BY对筛选出的数据进行处理。

举个例子:

SELECT purchase_price, COUNT(*)
FROM product
WHERE product_type = '衣服'
GROUP BY purchase_price;

运行结果:
在这里插入图片描述

5.2 常见错误

在使用聚合函数及GROUP BY子句时,经常出现的错误有:

  • 在聚合函数的SELECT子句中写了聚合键以外的列。使用COUNT等聚合函数时,SELECT子句中如果出现列名,只能是GROUP BY子句中指定的列名(也就是聚合键)。

举个例子:

SELECT purchase_price, COUNT(*)
FROM product
WHERE product_type = '衣服'
GROUP BY purchase_price;

说明:SELECT后面只能跟聚合函数或GROUP BY后面跟的列名,否则意义不明确,SQL会报错。

  • 在GROUP BY子句中使用列的别名。SELECT子句中可以通过AS来指定别名,但在GROUP BY中不能使用别名。因为在DBMS中 ,SELECT子句在GROUP BY子句后执行。
  • 在WHERE中使用聚合函数。原因是聚合函数的使用前提是结果集已经确定,而WHERE还处于确定结果集的过程中,所以相互矛盾会引发错误。 如果想指定条件,可以在SELECT,HAVING以及ORDER BY子句中使用聚合函数。

5.3 为聚合结果指定条件

5.3.1 用HAVING得到特定分组

将表使用GROUP BY分组后,怎样才能只取出其中两组?
在这里插入图片描述

  • 这里WHERE不可行,因为,WHERE子句只能指定**记录(行)**的条件,而不能用来指定组的条件(例如,“数据行数为 2 行”或者“平均值为 500”等)。可以在GROUP BY后使用HAVING子句。HAVING的用法类似WHERE。

5.3.2 HAVING语句特点

HAVING子句用于对分组进行过滤,可以使用数字、聚合函数和GROUP BY中指定的列名(聚合键)。

-- 数字
SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type
HAVING COUNT(*) = 2;
-- 错误形式(因为product_name不包含在GROUP BY聚合键中)
SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type
HAVING product_name = '圆珠笔';

【注意】HAVING语句后面跟的只能是数字、聚合函数或group by后面的列名,因为是对分组进行筛选。

6 对表进行排序

6.1 ORDER BY语法

SQL中的执行结果是随机排列的,当需要按照特定顺序排序时,可已使用ORDER BY子句。语法如下:

SELECT <列名1>, <列名2>, <列名3>, ……
FROM <表名>
ORDER BY <排序基准列1>, <排序基准列2>, ……

默认为升序排列,降序排列为DESC。以下几种情况需要注意,例子如下:

  • 第一种,降序排列,在order by语句最后加DESC:
-- 降序排列
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price DESC;
  • 第二种,多个排序键:
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price, product_id;

【注意】多个排序键意味着,先按第一列来排,如果第一列的值相同,再根据第二列的值进行升序/降序排序。

  • 第三种:当用于排序的列名中含有NULL时,NULL会在开头或末尾进行汇总
-- 当用于排序的列名中含有NULL时,NULL会在开头或末尾进行汇总。
SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY purchase_price;

6.2 ORDER BY中列名可使用别名

  • 前文讲GROUP BY中提到,GROUP BY 子句中不能使用SELECT 子句中定义的别名,但是在 ORDER BY 子句中却可以使用别名。为什么在GROUP BY中不可以而在ORDER BY中可以呢?这是因为SQL在使用 HAVING 子句时 SELECT 语句的顺序为:
    FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY
  • 其中SELECT的执行顺序在 GROUP BY 子句之后,ORDER BY 子句之前。也就是说,当在ORDER BY中使用别名时,已经知道了SELECT设置的别名存在,但是在GROUP BY中使用别名时还不知道别名的存在,所以不能在ORDER BY中可以使用别名,但是在GROUP BY中不能使用别名。

7 练习题

7.1 第一部分

1.编写一条SQL语句,从product(商品)表中选取出“登记日期(regist在2009年4月28日之后”的商品,查询结果要包含product name和regist_date两列。

答案:

SELECT product_name,regist_date
FROM product 
WHERE regist_date > '2009-4-28';

运行结果:
在这里插入图片描述
2. 请说出对product 表执行如下3条SELECT语句时的返回结果。

SELECT *
FROM product
WHERE purchase_price = NULL;

答案:返回的结果为空,因为NULL不能用“=”来判断。

SELECT *
FROM product
WHERE purchase_price <> NULL;

答案:返回的结果为空,因为NULL不能用“<>”来判断。

SELECT *
FROM product
WHERE product_name > NULL;

答案:返回的结果为空,因为NULL不能用“>”来判断。

3.代码清单2-22(2-2节)中的SELECT语句能够从product表中取出“销售单价(saleprice)比进货单价(purchase price)高出500日元及以上”的商品。请写出两条可以得到相同结果的SELECT语句。执行结果如下所示。

product_name | sale_price | purchase_price
-------------±-----------±-----------
T恤衫 | 1000 | 500
运动T恤 | 4000 | 2800
高压锅 | 6800 | 5000

答案:

SELECT product_name,sale_price,purchase_price
FROM product
where sale_price >= purchase_price + 500;
  1. 请写出一条SELECT语句,从product表中选取出满足“销售单价打九折之后利润高于100日元的办公用品和厨房用具”条件的记录。查询结果要包括product_name列、product_type列以及销售单价打九折之后的利润(别名设定为profit)。提示:销售单价打九折,可以通过saleprice列的值乘以0.9获得,利润可以通过该值减去purchase_price列的值获得。
SELECT product_name,product_type,(0.9*sale_price - purchase_price) as profit
FROM product
WHERE 0.9*sale_price - purchase_price > 100;

7.2 第二部分

  1. 请指出下述SELECT语句中所有的语法错误。
SELECT product id,SUM(product name)
--本SELECT语句中存在错误。
FROM product 
GROUP BY product_type 
WHERE regist_date > '2009-09-01';

答案:

  • SELECT后面跟的列在GROUP BY中未出现,因此逻辑有误。
  • GROUP BY 后面跟的筛选条件为HAVING,而非WHERE。
  • SELECT后面的列为product_id,而非product id,sum()中的列名为product _name,另外括号为英文括号,非中文括号。
  • 且product _name非数值型变量,不能用sum聚合函数。

2.请编写一条SELECT语句,求出销售单价(sale_price列)合计值是进货单价(purchase prilce列)合计值1.5倍的商品种类。执行结果如下所示。
在这里插入图片描述
答案:

SELECT product_type,sum(sale_price),sum(purchase_price)
FROM product
GROUP BY product_type
HAVING sum(sale_price)/sum(purchase_price)>=1.5;

运行结果:
在这里插入图片描述

3.此前我们曾经使用SELECT语句选取出了product(商品)表中的全部记录。当时我们使用了ORDER BY子句来指定排列顺序,但现在已经无法记起当时如何指定的了。请根据下列执行结果,思考ORDER BY子句的内容。
在这里插入图片描述

答案:

SELECT *
FROM product
ORDER BY regist_date DESC

8 参考

1.Datawhale-Alias-http://datawhale.club/t/topic/476

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值