题一
表:Products
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| product_id | int |
| low_fats | enum |
| recyclable | enum |
+-------------+---------+
product_id
是该表的主键(具有唯一值的列)。
low_fats 是枚举类型,取值为以下两种 ('Y', 'N'),其中 'Y' 表示该产品是低脂产品,'N' 表示不是低脂产品。
recyclable 是枚举类型,取值为以下两种 ('Y', 'N'),其中 'Y' 表示该产品可回收,而 'N' 表示不可回收。
编写解决方案找出既是低脂又是可回收的产品编号。
方法一:执行511ms
select product_id from Products where low_fats = 'Y' AND recyclable = 'Y'
方法二:执行509ms
select
product_id
from
Products
where
low_fats in('Y') and recyclable in('Y')
在复杂的查询中使用IN
操作符可能会引入性能问题,因为它需要将每个值与列表中的值进行比较,可能会导致性能下降
题二
表: Customer
+-------------+---------+ | Column Name | Type | +-------------+---------+ | id | int | | name | varchar | | referee_id | int | +-------------+---------+ 在 SQL 中,id 是该表的主键列。 该表的每一行表示一个客户的 id、姓名以及推荐他们的客户的 id。
找出那些 没有被 id = 2
的客户 推荐 的客户的姓名
提示:null值不能作判断(不能xx = null),简单的取反并不能获得null的值 即使用 <>
(!=
) 和 IS NULL
方法一(没有推荐人和不等于2推荐人的情况):463ms
select name from Customer where referee_id != 2 or referee_id is null
方法二:515ms
select name from Customer where referee_id <> 2 or referee_id is null
方法三(将空值赋为0再查询):459ms
select name from Customer where ifnull(referee_id, 0) != 2
题三
World
表:
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| name | varchar |
| continent | varchar |
| area | int |
| population | int |
| gdp | bigint |
+-------------+---------+
name
是该表的主键(具有唯一值的列)。
这张表的每一行提供:国家名称、所属大陆、面积、人口和 GDP 值。
如果一个国家满足下述两个条件之一,则认为该国是 大国 :
- 面积至少为 300 万平方公里(即,
3000000 km2
),或者 - 人口至少为 2500 万(即
25000000
)
编写解决方案找出 大国 的国家名称、人口和面积。
方法一:256ms
select name,population,area from World where area >= 3000000 or population >=25000000
方法二(使用 WHERE 子句和 UNION):264ms
#使用 or 会使索引会失效,在数据量较大的时候查找效率较低,通常建议使用 union 代替 or
select name,population,area from World where area >= 3000000
union
select name,population,area from World where population >=25000000
题四
Views
表:
+---------------+---------+ | Column Name | Type | +---------------+---------+ | article_id | int | | author_id | int | | viewer_id | int | | view_date | date | +---------------+---------+ 此表可能会存在重复行。(换句话说,在 SQL 中这个表没有主键) 此表的每一行都表示某人在某天浏览了某位作者的某篇文章。 请注意,同一人的 author_id 和 viewer_id 是相同的。
请查询出所有浏览过自己文章的作者
结果按照 id
升序排列。
提示:去重(distinct)、desc(降序)、asc(升序)
方法:426ms
SELECT DISTINCT author_id as id from Views
where author_id = viewer_id
ORDER BY id ASC
题五
表:Tweets
+----------------+---------+ | Column Name | Type | +----------------+---------+ | tweet_id | int | | content | varchar | +----------------+---------+ 在 SQL 中,tweet_id 是这个表的主键。 这个表包含某社交媒体 App 中所有的推文。
查询所有无效推文的编号(ID)。当推文内容中的字符数严格大于 15
时,该推文是无效的
提示:分别使用 LENGTH
和 CHAR_LENGTH
函数来统计 varchar
列中字符的数量
方法一:550ms
select tweet_id from tweets where char_LENGTH(content) > 15
方法二:611ms
select tweet_id from tweets where LENGTH(content) > 15
LENGTH
函数通常计算的是字符串的字节数。在大多数单字节字符集中(如latin1),每个字符占用一个字节,因此 LENGTH
函数返回的是字符串的实际字节数。但是,当涉及到多字节字符集(如UTF-8,UTF-16)时,一个字符可能会占用多个字节。这意味着在多字节字符集中,LENGTH
函数返回的是字符串实际占用的字节数,而不是字符串中的字符数。
CHAR_LENGTH
函数计算的是字符串的字符数。它基于给定的字符集计算字符串中的字符数量,而不考虑字符所占用的字节数。这意味着,无论字符集中的字符是单字节还是多字节,CHAR_LENGTH
函数都会返回字符串中的实际字符数
SELECT LENGTH('你好') AS length, -- 结果为 6(UTF-8中2个中文字符,每个字符占3个字节,共6个字节)
CHAR_LENGTH('你好') AS char_length; -- 结果为 2(两个中文字符)