MySQL第七章:MySQL的基本函数

MySQL第七章:MySQL的基本函数

**内容来自: **

1、b站mosh老师的SQL课程(第七章) 【中字】SQL进阶教程 | 史上最易懂SQL教程!10小时零基础成长SQL大师!!_哔哩哔哩_bilibili www.bilibili.com/video/BV1UE41147KC/?p=17&spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=171e84ea90c06aa5a434d7fa2502e75c

2、https://zhuanlan.zhihu.com/p/222865842(非常感谢这位知乎大佬,笔记、课件写的很详细)

3、菜鸟教程

SQL必知必会(第五版)》这部分内容得一月统一更新

4、菊花酱数据分析

各数据库字段之间的关联

数值函数

SELECT ROUND(5.7365, 2)  -- 四舍五入(保留2位小数)
SELECT TRUNCATE(5.7365, 2)  -- 截断(保留2位小数73,移除后面两位小数没有四舍五入)
SELECT CEILING(5.2)  -- 天花板函数,大于等于此数的最小整数(向上取整)
SELECT FLOOR(5.6)  -- 地板函数,小于等于此数的最大整数(向下取整)
SELECT ABS(-5.2)  -- 绝对值
SELECT RAND()  -- 随机函数,0到1的随机值

补充**MySQL 数字函数**:

函数名描述实例
ABS(x)返回 x 的绝对值返回 -1 的绝对值:SELECT ABS(-1) -- 返回1
ACOS(x)求 x 的反余弦值(单位为弧度),x 为一个数值SELECT ACOS(0.25);
ASIN(x)求反正弦值(单位为弧度),x 为一个数值SELECT ASIN(0.25);
ATAN(x)求反正切值(单位为弧度),x 为一个数值SELECT ATAN(2.5);
ATAN2(n, m)求从原点 (0, 0) 到点 (n, m) 的角度反正切值(单位为弧度)SELECT ATAN2(-0.8, 2);
AVG(expression)返回一个表达式的平均值,expression 是一个字段返回 Products 表中Price 字段的平均值:SELECT AVG(Price) AS AveragePrice FROM Products;
CEIL(x)返回大于或等于 x 的最小整数SELECT CEIL(1.5) -- 返回2
CEILING(x)返回大于或等于 x 的最小整数SELECT CEILING(1.5); -- 返回2
COS(x)求余弦值(参数是弧度)SELECT COS(2);
COT(x)求余切值(参数是弧度)SELECT COT(6);
COUNT(expression)返回查询的记录总数,expression 参数是一个字段或者 * 号返回 Products 表中 products 字段总共有多少条记录:SELECT COUNT(ProductID) AS NumberOfProducts FROM Products;
DEGREES(x)将弧度转换为角度SELECT DEGREES(3.1415926535898) -- 180
n DIV m整除,n 为被除数,m 为除数计算 10 除于 5:SELECT 10 DIV 5; -- 2
EXP(x)返回 e 的 x 次方计算 e 的三次方:SELECT EXP(3) -- 20.085536923188
FLOOR(x)返回小于或等于 x 的最大整数小于或等于 1.5 的整数:SELECT FLOOR(1.5) -- 返回1
GREATEST(expr1, expr2, expr3, …)返回列表中的最大值返回以下数字列表中的最大值:SELECT GREATEST(3, 12, 34, 8, 25); -- 34返回以下字符串列表中的最大值:SELECT GREATEST("Google", "Runoob", "Apple"); -- Runoob
LEAST(expr1, expr2, expr3, …)返回列表中的最小值返回以下数字列表中的最小值:SELECT LEAST(3, 12, 34, 8, 25); -- 3返回以下字符串列表中的最小值:SELECT LEAST("Google", "Runoob", "Apple"); -- Apple
LN返回数字的自然对数,以 e 为底。返回 2 的自然对数:SELECT LN(2); -- 0.6931471805599453
LOG(x) 或 LOG(base, x)返回自然对数(以 e 为底的对数),如果带有 base 参数,则 base 为指定带底数。SELECT LOG(20.085536923188) -- 3 SELECT LOG(2, 4); -- 2
LOG10(x)返回以 10 为底的对数SELECT LOG10(100) -- 2
LOG2(x)返回以 2 为底的对数返回以 2 为底 6 的对数:SELECT LOG2(6); -- 2.584962500721156
MAX(expression)返回字段 expression 中的最大值返回数据表 Products 中字段 Price 的最大值:SELECT MAX(Price) AS LargestPrice FROM Products;
MIN(expression)返回字段 expression 中的最小值返回数据表 Products 中字段 Price 的最小值:SELECT MIN(Price) AS MinPrice FROM Products;
MOD(x,y)返回 x 除以 y 以后的余数5 除于 2 的余数:SELECT MOD(5,2) -- 1
PI()返回圆周率(3.141593)SELECT PI() --3.141593
POW(x,y)返回 x 的 y 次方2 的 3 次方:SELECT POW(2,3) -- 8
POWER(x,y)返回 x 的 y 次方2 的 3 次方:SELECT POWER(2,3) -- 8
RADIANS(x)将角度转换为弧度180 度转换为弧度:SELECT RADIANS(180) -- 3.1415926535898
RAND()返回 0 到 1 的随机数SELECT RAND() --0.93099315644334
ROUND(x [,y])返回离 x 最近的整数,可选参数 y 表示要四舍五入的小数位数,如果省略,则返回整数。SELECT ROUND(1.23456) --1 SELECT ROUND(345.156, 2) -- 345.16
SIGN(x)返回 x 的符号,x 是负数、0、正数分别返回 -1、0 和 1SELECT SIGN(-10) -- (-1)
SIN(x)求正弦值(参数是弧度)SELECT SIN(RADIANS(30)) -- 0.5
SQRT(x)返回x的平方根25 的平方根:SELECT SQRT(25) -- 5
SUM(expression)返回指定字段的总和计算 OrderDetails 表中字段 Quantity 的总和:SELECT SUM(Quantity) AS TotalItemsOrdered FROM OrderDetails;
TAN(x)求正切值(参数是弧度)SELECT TAN(1.75); -- -5.52037992250933
TRUNCATE(x,y)返回数值 x 保留到小数点后 y 位的值(与 ROUND 最大的区别是不会进行四舍五入)SELECT TRUNCATE(1.23456,3) -- 1.234

表格参考菜鸟教程

注意:

MySQL全部数值函数可谷歌 ‘mysql numeric function’,第一个就是官方文档。

字符串函数

长度、转大小写

SELECT LENGTH('sky')  -- 字符串字符个数/长度(LENGTH)
SELECT UPPER('sky')  -- 转大写
SELECT LOWER('Sky')  -- 转小写

处理/修剪(trim)字符串前后的空格(L、R 表示 LEFT、RIGHT):

SELECT LTRIM('  Sky')
SELECT RTRIM('Sky  ')
SELECT TRIM(' Sky ')

切片

-- 取左边
SELECT LEFT('Kindergarden', 4)  -- 取左边(LEFT)4个字符
-- 取右边
SELECT RIGHT('Kindergarden', 6)  -- 取右边(RIGHT)6个字符
-- 取中间
SELECT SUBSTRING('Kindergarden', 7, 6)
-- 'Kindergarden':要从中提取子字符串的字符串
-- 7:字符串提取的起始位置。在大多数 SQL 语言中,字符串的索引从 1 开始。
-- 6:要提取的字符数,若省略第3参数(子串长度)则一直截取到最后

定位

SELECT LOCATE('gar', 'Kindergarden')  -- 定位gar在'Kindergarden'首次出现的位置
-- 没有的话MySQL返回0
-- 这个定位/查找函数依然是不区分大小写的

替换

SELECT REPLACE('Kindergarten', 'garten', 'garden')

连接

USE sql_store;

SELECT CONCAT(first_name, ' ', last_name) AS full_name
-- concatenate v. 连接
FROM customers

补充**MySQL 字符串函数**

函数描述实例
ASCII(s)返回字符串 s 的第一个字符的 ASCII 码。返回 CustomerName 字段第一个字母的 ASCII 码:
SELECT ASCII(CustomerName) AS NumCodeOfFirstChar FROM Customers;
CHAR_LENGTH(s)返回字符串 s 的字符数返回字符串 RUNOOB 的字符数
SELECT CHAR_LENGTH("RUNOOB") AS LengthOfString;
CHARACTER_LENGTH(s)返回字符串 s 的字符数,等同于 CHAR_LENGTH(s)返回字符串 RUNOOB 的字符数
SELECT CHARACTER_LENGTH("RUNOOB") AS LengthOfString;
CONCAT(s1,s2…sn)字符串 s1,s2 等多个字符串合并为一个字符串合并多个字符串SELECT CONCAT("SQL ", "Runoob ", "Gooogle ", "Facebook") AS ConcatenatedString;
CONCAT_WS(x, s1,s2…sn)同 CONCAT(s1,s2,…) 函数,但是每个字符串之间要加上 x,x 可以是分隔符合并多个字符串,并添加分隔符:SELECT CONCAT_WS("-", "SQL", "Tutorial", "is", "fun!")AS ConcatenatedString;
注意:ws全称with separator
FIELD(s,s1,s2…)返回第一个字符串 s 在字符串列表(s1,s2…)中的位置返回字符串 c 在列表值中的位置:SELECT FIELD("c", "a", "b", "c", "d", "e");
FIND_IN_SET(s1,s2)返回在字符串s2中与s1匹配的字符串的位置返回字符串 c 在指定字符串中的位置:SELECT FIND_IN_SET("c", "a,b,c,d,e");
FORMAT(x,n)函数可以将数字 x 进行格式化 “#,###.##”, 将 x 保留到小数点后 n 位,最后一位四舍五入。格式化数字 “#,###.##” 形式:SELECT FORMAT(250500.5634, 2); -- 输出 250,500.56
INSERT(s1,x,len,s2)字符串 s2 替换 s1 的 x 位置开始长度为 len 的字符串从字符串第一个位置开始的 6 个字符替换为 runoob:SELECT INSERT("google.com", 1, 6, "runoob"); -- 输出:runoob.com
LOCATE(s1,s)从字符串 s 中获取 s1 的开始位置获取 b 在字符串 abc 中的位置:SELECT LOCATE('st','myteststring'); -- 5返回字符串 abc 中 b 的位置:SELECT LOCATE('b', 'abc') -- 2
LCASE(s)将字符串 s 的所有字母变成小写字母字符串 RUNOOB 转换为小写:SELECT LCASE('RUNOOB') -- runoob
LEFT(s,n)返回字符串 s 的前 n 个字符返回字符串 runoob 中的前两个字符:SELECT LEFT('runoob',2) -- ru
LOWER(s)将字符串 s 的所有字母变成小写字母字符串 RUNOOB 转换为小写:SELECT LOWER('RUNOOB') -- runoob
LPAD(s1,len,s2)在字符串 s1 的开始处填充字符串 s2,使字符串长度达到 len将字符串 xx 填充到 abc 字符串的开始处:SELECT LPAD('abc',5,'xx') -- xxabc
注意:pad表示填充
LTRIM(s)去掉字符串 s 开始处的空格去掉字符串 RUNOOB开始处的空格:SELECT LTRIM(" RUNOOB") AS LeftTrimmedString;-- RUNOOB
MID(s,n,len)从字符串 s 的 n 位置截取长度为 len 的子字符串,同 SUBSTRING(s,n,len)从字符串 RUNOOB 中的第 2 个位置截取 3个 字符:SELECT MID("RUNOOB", 2, 3) AS ExtractString; -- UNO
POSITION(s1 IN s)从字符串 s 中获取 s1 的开始位置返回字符串 abc 中 b 的位置:SELECT POSITION('b' in 'abc') -- 2
REPEAT(s,n)将字符串 s 重复 n 次将字符串 runoob 重复三次:SELECT REPEAT('runoob',3) -- runoobrunoobrunoob
REPLACE(s,s1,s2)将字符串 s2 替代字符串 s 中的字符串 s1将字符串 abc 中的字符 a 替换为字符 x:SELECT REPLACE('abc','a','x') --xbc
REVERSE(s)将字符串s的顺序反过来将字符串 abc 的顺序反过来:SELECT REVERSE('abc') -- cba
RIGHT(s,n)返回字符串 s 的后 n 个字符返回字符串 runoob 的后两个字符:SELECT RIGHT('runoob',2) -- ob
RPAD(s1,len,s2)在字符串 s1 的结尾处添加字符串 s2,使字符串的长度达到 len将字符串 xx 填充到 abc 字符串的结尾处:SELECT RPAD('abc',5,'xx') -- abcxx
RTRIM(s)去掉字符串 s 结尾处的空格去掉字符串 RUNOOB 的末尾空格:SELECT RTRIM("RUNOOB ") AS RightTrimmedString; -- RUNOOB
SPACE(n)返回 n 个空格返回 10 个空格:SELECT SPACE(10);
STRCMP(s1,s2)比较字符串 s1 和 s2,如果 s1 与 s2 相等返回 0 ,如果 s1>s2 返回 1,如果 s1<s2 返回 -1比较字符串:SELECT STRCMP("runoob", "runoob"); -- 0
注意:strcmp表示string compare
SUBSTR(s, start, length)从字符串 s 的 start 位置截取长度为 length 的子字符串从字符串 RUNOOB 中的第 2 个位置截取 3个 字符:SELECT SUBSTR("RUNOOB", 2, 3) AS ExtractString; -- UNO
SUBSTRING(s, start, length)从字符串 s 的 start 位置截取长度为 length 的子字符串,等同于 SUBSTR(s, start, length)从字符串 RUNOOB 中的第 2 个位置截取 3个 字符:SELECT SUBSTRING("RUNOOB", 2, 3) AS ExtractString; -- UNO
SUBSTRING_INDEX(s, delimiter, number)返回从字符串 s 的第 number 个出现的分隔符 delimiter 之后的子串。 如果 number 是正数,返回第 number 个字符左边的字符串。 如果 number 是负数,从右边开始返回第(number 的绝对值)个字符右边的字符串。SELECT SUBSTRING_INDEX('a*b','*',1) -- a SELECT SUBSTRING_INDEX('a*b','*',-1) -- b SELECT SUBSTRING_INDEX(SUBSTRING_INDEX('a*b*c*d*e','*',3),'*',-1) -- c
TRIM(s)去掉字符串 s 开始和结尾处的空格去掉字符串 RUNOOB 的首尾空格:SELECT TRIM(' RUNOOB ') AS TrimmedString;
UCASE(s)将字符串转换为大写将字符串 runoob 转换为大写:SELECT UCASE("runoob"); -- RUNOOB
UPPER(s)将字符串转换为大写将字符串 runoob 转换为大写:SELECT UPPER("runoob"); -- RUNOOB

注意:

查看全部搜索关键词 ‘mysql string functions’

日期函数

当前时间

SELECT NOW()  -- 2020-09-12 08:50:46
SELECT CURDATE()  -- current date, 2020-09-12
SELECT CURTIME()  -- current time, 08:50:46

注意:

以上函数将返回时间日期对象

提取时间日期对象中的元素

SELECT YEAR(NOW())  -- 2020
SELECT DAYNAME(NOW())  -- Saturday
SELECT MONTHNAME(NOW())  -- September

注意:

  • 还有MONTH, DAY, HOUR, MINUTE, SECOND;
  • 以上函数均返回整数,MINUTE()、SECOND()返回字符串的。

EXTRACT()

标准SQL语句有一个类似的函数 EXTRACT():EXTRACT(单位 FROM 日期时间对象)

SELECT EXTRACT(YEAR FROM NOW())

注意:

  • 若需要在不同DBMS中录入代码,最好用EXTRACT();
  • 单位也可以是MONTH, DAY, HOUR ……

练习

题目:

返回今年的订单

USE sql_store;

SELECT * 
FROM orders
WHERE YEAR(order_date) = YEAR(now())

补充MySQL 日期函数

函数名描述实例
ADDDATE(d,n)计算起始日期 d 加上 n 天的日期SELECT ADDDATE("2017-06-15", INTERVAL 10 DAY); ->2017-06-25
ADDTIME(t,n)n 是一个时间表达式,时间 t 加上时间表达式 n加 5 秒:SELECT ADDTIME('2011-11-11 11:11:11', 5); ->2011-11-11 11:11:16 (秒)添加 2 小时, 10 分钟, 5 秒:SELECT ADDTIME("2020-06-15 09:34:21", "2:10:5"); -> 2020-06-15 11:44:26
CURDATE()返回当前日期SELECT CURDATE(); -> 2018-09-19
CURRENT_DATE()返回当前日期SELECT CURRENT_DATE(); -> 2018-09-19
CURRENT_TIME返回当前时间SELECT CURRENT_TIME(); -> 19:59:02
CURRENT_TIMESTAMP()返回当前日期和时间SELECT CURRENT_TIMESTAMP() -> 2018-09-19 20:57:43
CURTIME()返回当前时间SELECT CURTIME(); -> 19:59:02
DATE()从日期或日期时间表达式中提取日期值SELECT DATE("2017-06-15"); -> 2017-06-15
DATEDIFF(d1,d2)计算日期 d1->d2 之间相隔的天数SELECT DATEDIFF('2001-01-01','2001-02-02') -> -32
DATE_ADD(d,INTERVAL expr type)计算起始日期 d 加上一个时间段后的日期,type 值可以是:
MICROSECOND;
SECOND;
MINUTE;
HOUR;
DAY;
WEEK;
MONTH;
QUARTER;
YEAR;
SECOND_MICROSECOND;
MINUTE_MICROSECOND;
MINUTE_SECOND;
HOUR_MICROSECOND;
HOUR_SECOND HOUR_MINUTE;
DAY_MICROSECOND;
DAY_SECOND DAY_MINUTE;
DAY_HOUR YEAR_MONTH.
SELECT DATE_ADD("2017-06-15", INTERVAL 10 DAY); -> 2017-06-25; SELECT DATE_ADD("2017-06-15 09:34:21", INTERVAL 15 MINUTE); -> 2017-06-15 09:49:21 SELECT DATE_ADD("2017-06-15 09:34:21", INTERVAL -3 HOUR); ->2017-06-15 06:34:21 SELECT DATE_ADD("2017-06-15 09:34:21", INTERVAL -3 MONTH); ->2017-04-15
DATE_FORMAT(d,f)按表达式 f的要求显示日期 dSELECT DATE_FORMAT('2011-11-11 11:11:11','%Y-%m-%d %r') -> 2011-11-11 11:11:11 AM
注意:%r 用于表示 12 小时制的时间格式(AM/PM)
DATE_SUB(date,INTERVAL expr type)函数从日期减去指定的时间间隔。Orders 表中 OrderDate 字段减去 2 天:SELECT OrderId,DATE_SUB(OrderDate,INTERVAL 2 DAY) AS OrderPayDate FROM Orders
DAY(d)返回日期值 d 的日期部分SELECT DAY("2017-06-15"); -> 15
DAYNAME(d)返回日期 d 是星期几,如 Monday,TuesdaySELECT DAYNAME('2011-11-11 11:11:11') ->Friday
DAYOFMONTH(d)计算日期 d 是本月的第几天SELECT DAYOFMONTH('2011-11-11 11:11:11') ->11
DAYOFWEEK(d)日期 d 今天是星期几,1 星期日,2 星期一,以此类推SELECT DAYOFWEEK('2011-11-11 11:11:11') ->6
DAYOFYEAR(d)计算日期 d 是本年的第几天SELECT DAYOFYEAR('2011-11-11 11:11:11') ->315
EXTRACT(type FROM d)从日期 d 中获取指定的值,type 指定返回的值。 type可取值为:
MICROSECOND;
SECOND;
MINUTE;
HOUR;
DAY;
WEEK
MONTH
QUARTER
YEAR
SECOND_MICROSECOND
MINUTE_MICROSECOND
MINUTE_SECOND
HOUR_MICROSECOND
HOUR_SECOND
HOUR_MINUTE
DAY_MICROSECOND
DAY_SECOND
DAY_MINUTE
DAY_HOUR
YEAR_MONTH
注意:如果date参数是一个DATE值并且你的计算仅仅包含YEAR、MONTH和DAY部分(即,没有时间部分),结果是一个DATE值。否则结果是一个DATETIME值;
如:
YEAR_MONTH: 年和月拼成的数字
HOUR_SECOND: 小时+分钟+秒拼成的数字
DAY_MINUTE :日+小时+分钟拼成的数字
DAY_SECOND:日+小时+分钟+秒拼成的数字
SELECT EXTRACT(MINUTE FROM '2011-11-11 11:11:11') -> 11
FROM_DAYS(n)计算从 0000 年 1 月 1 日开始 n 天后的日期SELECT FROM_DAYS(1111) -> 0003-01-16
HOUR(t)返回 t 中的小时值SELECT HOUR('1:2:3') -> 1
LAST_DAY(d)返回给给定日期的那一月份的最后一天SELECT LAST_DAY("2017-06-20"); -> 2017-06-30
LOCALTIME()返回当前日期和时间SELECT LOCALTIME() -> 2018-09-19 20:57:43
LOCALTIMESTAMP()返回当前日期和时间SELECT LOCALTIMESTAMP() -> 2018-09-19 20:57:43
MAKEDATE(year, day-of-year)基于给定参数年份 year 和所在年中的天数序号 day-of-year 返回一个日期SELECT MAKEDATE(2017, 3); -> 2017-01-03
MAKETIME(hour, minute, second)组合时间,参数分别为小时、分钟、秒SELECT MAKETIME(11, 35, 4); -> 11:35:04
MICROSECOND(date)返回日期参数所对应的微秒数
注意:1秒= 1 0 6 10^6 106微秒
SELECT MICROSECOND("2017-06-20 09:34:00.000023"); -> 23
MINUTE(t)返回 t 中的分钟值SELECT MINUTE('1:2:3') -> 2
MONTHNAME(d)返回日期当中的月份名称,如 NovemberSELECT MONTHNAME('2011-11-11 11:11:11') -> November
MONTH(d)返回日期d中的月份值,1 到 12SELECT MONTH('2011-11-11 11:11:11') ->11
NOW()返回当前日期和时间SELECT NOW() -> 2018-09-19 20:57:43
PERIOD_ADD(period, number)为 年-月 组合日期添加一个时段SELECT PERIOD_ADD(201703, 5); -> 201708
PERIOD_DIFF(period1, period2)返回两个时段之间的月份差值SELECT PERIOD_DIFF(201710, 201703); -> 7
QUARTER(d)返回日期d是第几季节,返回 1 到 4SELECT QUARTER('2011-11-11 11:11:11') -> 4
SECOND(t)返回 t 中的秒钟值SELECT SECOND('1:2:3') -> 3
SEC_TO_TIME(s)将以秒为单位的时间 s 转换为时分秒的格式SELECT SEC_TO_TIME(4320) -> 01:12:00
STR_TO_DATE(string, format_mask)将字符串转变为日期SELECT STR_TO_DATE("August 10 2017", "%M %d %Y"); -> 2017-08-10
注意:%M 表示August为月份信息,%d表示10为日信息,%Y表示2017为年份信息
SUBDATE(d,n)日期 d 减去 n 天后的日期SELECT SUBDATE('2011-11-11 11:11:11', 1) ->2011-11-10 11:11:11 (默认是天)
SUBTIME(t,n)时间 t 减去 n 秒的时间SELECT SUBTIME('2011-11-11 11:11:11', 5) ->2011-11-11 11:11:06 (秒)
SYSDATE()返回当前日期和时间SELECT SYSDATE() -> 2018-09-19 20:57:43
TIME(expression)提取传入表达式的时间部分SELECT TIME("19:30:10"); -> 19:30:10
TIME_FORMAT(t,f)按表达式 f 的要求显示时间 tSELECT TIME_FORMAT('11:11:11','%r') 11:11:11 AM
TIME_TO_SEC(t)将时间 t 转换为秒SELECT TIME_TO_SEC('1:12:00') -> 4320
TIMEDIFF(time1, time2)计算时间差值mysql> SELECT TIMEDIFF("13:10:11", "13:10:10"); -> 00:00:01 mysql> SELECT TIMEDIFF('2000:01:01 00:00:00', -> '2000:01:01 00:00:00.000001'); -> '-00:00:00.000001' mysql> SELECT TIMEDIFF('2008-12-31 23:59:59.000001', -> '2008-12-30 01:01:01.000002'); -> '46:58:57.999999'
TIMESTAMP(expression, interval)单个参数时,函数返回日期或日期时间表达式;有2个参数时,将参数加和
注意:TIMESTAMP表示时间戳
mysql> SELECT TIMESTAMP("2017-07-23", "13:10:11"); -> 2017-07-23 13:10:11 mysql> SELECT TIMESTAMP('2003-12-31'); -> '2003-12-31 00:00:00' mysql> SELECT TIMESTAMP('2003-12-31 12:00:00','12:00:00'); -> '2004-01-01 00:00:00'
TIMESTAMPDIFF(unit,datetime_expr1,datetime_expr2)计算时间差,返回 datetime_expr2 − datetime_expr1 的时间差mysql> SELECT TIMESTAMPDIFF(DAY,'2003-02-01','2003-05-01'); // 计算两个时间相隔多少天 -> 89 mysql> SELECT TIMESTAMPDIFF(MONTH,'2003-02-01','2003-05-01'); // 计算两个时间相隔多少月(注意若不足三个月,最后会输出2 -> 3 mysql> SELECT TIMESTAMPDIFF(YEAR,'2002-05-01','2001-01-01'); // 计算两个时间相隔多少年 -> -1 mysql> SELECT TIMESTAMPDIFF(MINUTE,'2003-02-01','2003-05-01 12:05:55'); // 计算两个时间相隔多少分钟 -> 128885
TO_DAYS(d)计算日期 d 距离 0000 年 1 月 1 日的天数SELECT TO_DAYS('0001-01-01 01:01:01') -> 366
WEEK(d)计算日期 d 是本年的第几个星期,范围是 0 到 53SELECT WEEK('2011-11-11 11:11:11') -> 45
WEEKDAY(d)日期 d 是星期几,0 表示星期一,1 表示星期二SELECT WEEKDAY("2017-06-15"); -> 3
WEEKOFYEAR(d)计算日期 d 是本年的第几个星期,范围是 0 到 53SELECT WEEKOFYEAR('2011-11-11 11:11:11') -> 45
YEAR(d)返回年份SELECT YEAR("2017-06-15"); -> 2017
YEARWEEK(date, mode)返回年份及第几周(0到53),mode 中 0 表示周天为一周的第一天,1表示周一为一周的第一天,以此类推SELECT YEARWEEK("2017-06-15"); -> 201724

格式化日期和时间

  • DATE_FORMAT(date, format) 将 date 根据 format 字符串进行格式化;

  • TIME_FORMAT(time, format) 类似于 DATE_FORMAT 函数,但这里 format 字符串只能包含用于小时,分钟,秒和微秒的格式说明符。其他说明符产生一个 NULL 值或0

注意:

很多像这种完全不需要记也不可能记得完,重要的是知道有这么个可以实现这个功能的函数,具体的**格式说明符(Specifiers)**可以需要的时候去查,至少有两种方法:

  1. 直接谷歌关键词 如 mysql date format functions, 其实是在官方文档的 12.7 Date and Time Functions 小结里,有两个函数的说明和 specifiers 表
  2. 用软件里的帮助功能,如 workbench 里的 HELP INDEX 打开官方文档查询或者右侧栏的 automatic comtext help (其是也是查官方文档,不过是自动的)

实例

SELECT DATE_FORMAT(NOW(), '%M %d, %Y')  -- September 12, 2020

-- 格式说明符里,大小写是不同的(%M:英文月份名称,%m:数字月份名称)
SELECT TIME_FORMAT(NOW(), '%H:%i %p')  -- 11:07 AM
-- p:pm/am

%r和%p的区别

  • %r是将时间(18:06:49)整体变为am/pm格式(06:06:49 PM);
  • %p只是单纯在后面加个PM。

计算日期和时间

有时需要对日期事件对象进行运算,如增加一天或算两个时间的差值之类,介绍一些最有用的日期时间计算函数:

  1. DATE_ADD, DATE_SUB
  2. DATEDIFF
  3. TIME_TO_SEC

增加或减少一定的天数、月数、年数、小时数

SELECT DATE_ADD(NOW(), INTERVAL -1 DAY) -- 返回昨天的同一时间
SELECT DATE_SUB(NOW(), INTERVAL 1 YEAR)-- 返回会去年的同一天同一时间

计算日期差异

SELECT DATEDIFF('2019-01-01 09:00', '2019-01-05')  -- -4
SELECT DATEDIFF('2019-01-05', '2019-01-01')  -- 4
SELECT DATEDIFF('2019-01-05 09:00', '2019-01-01 17:00')  -- 4
-- 会忽略时间部分,只算日期差异
-- 借助 TIME_TO_SEC 函数计算时间差异
-- TIME_TO_SEC:计算从 00:00 到某时间经历的秒数
SELECT TIME_TO_SEC('09:00')  -- 32400
SELECT TIME_TO_SEC('09:00') - TIME_TO_SEC('09:02')  -- -120

IFNULL和COALESCE函数

两个用来替换空值的函数:IFNULL, COALESCE

注意:

  • coalese后者更灵活;
  • coalese:vi. 合并;结合;联合

案例1

题目:

将 orders 里 shipper.id中的空值替换为 ‘Not Assigned’(未分配)

USE sql_store;

SELECT 
    order_id,
    IFNULL(shipper_id, 'Not Assigned') AS shipper
    
FROM orders

案例2

题目:

将 orders 里 shipper.id中的空值替换为 comments,若 comments 也为空则替换为 ‘Not Assigned’(未分配)

USE sql_store;

SELECT 
    order_id,
    COALESCE(shipper_id, comments, 'Not Assigned') AS shipper
FROM orders

注意:

COALESCE(Column1, Column2, Column3):会先返回(Column1, Column2, Column3)中的第一个非空值;在此例中,如果前两个字段值也为空,则替换为’Not Assigned’

练习

题目:返回一个有如下两列的查询结果:

  1. customer (顾客的全名)
  2. phone (没有的话,显示’Unknown’)
USE sql_store;

SELECT 
    CONCAT(first_name, ' ', last_name) AS customer,
    IFNULL/COALESCE(phone, 'Unknown') AS phone   
FROM customer

IF函数

根据是否满足条件返回不同的值:IF(条件表达式, 返回值1, 返回值2) ,返回值可以是任何东西(数值、文本、日期时间、空值null 均可)

案例

题目:

将订单表中2019年的订单,category字段填充为‘active’(注意:active表示活跃);如不是2019年的订单,category字段填充为archived(注意:archived表示存档)。

USE sql_store;

SELECT 
    *,
    IF(YEAR(order_date) = YEAR(NOW()),
       'Active',
       'Archived') AS category
FROM orders

练习

题目:

得到包含如下字段的表:

  1. product_id
  2. name (产品名称)
  3. orders (该产品出现在订单中的次数)
  4. frequency (根据是否多于一次而分类为’Once’或’Many times’)
USE sql_store;

SELECT 
    product_id,
    name,
    COUNT(*) AS orders,
    IF(COUNT(*) = 1, 'Once', 'Many times') AS frequency
    /* 因为之后的内连接筛选掉了无订单的商品,
    所以这里不变考虑次数为0的情况 */
FROM products
JOIN order_items USING(product_id)
GROUP BY product_id

注意:

  1. 若写成 IF(orders = 1, 'Once', 'Many times') AS frequency
    会报错:Error Code: 1054. Unknown column ‘orders’ in ‘field list’;

  2. 若写成 IF((SELECT orders) = 1, 'Once', 'Many times') AS frequency
    会报错:Error Code: 1247. Reference ‘orders’ not supported (reference to group function)

    解释第二点错误的原因?

    IF 函数的条件判断部分,不能直接引用其他列的别名

CASE运算符

当分类大于两种时,可以用IF嵌套,也可以用CASE语句(后者可读性更好)。CASE语句常用于有多个测试表达式且针对每个测试表达式范围返回不同值。

在实际工作中,经常会涉及以下两类问题:

  • 数据的映射处理:比如将离散的数字变成有意义的业务说明,或是将连续的数值映射到离散的区间带
  • 有针对性的筛选计算:将细颗粒单位转换为粗颗粒单位的聚合运算

这两类问题,我们通常使用CASE WHEN语句来解决。CASE语句其实就是MySQL中的控制流语句,类似于其他很多编程工具中的IF…THEN…的分支判断逻辑。

关于CASE WHEN的表达方式有两种:“简单CASE函数法”和“CASE搜索函数法”。这两种方法各有优点,比如“简单CASE函数法”的语法更加简洁,但是只能处理等式的问题,“CASE搜索函数法”更加灵活好用,可以处理等式问题也可以处理不等式问题

语句结构

简单CASE函数法

CASE 
    WHEN <when_condition> THEN <result>
	[WHEN <when_condition> THEN <result>]
	[……]
	[ELSE <else_result>]-- (else语句可选)
END

注意:

CASE最后要用end收尾。

CASE搜索函数法

CASE
    WHEN <bool_condition> THEN <result>
    [WHEN <bool_condition> THEN <result>]
    [……]
    [ELSE <else_result>]-- (else语句可选)
END

案例

将订单分为三类:2019年的是 ‘Active’, 2018年的是 ‘Last Year’, 2018年以前的是 ‘Achived’:

USE sql_store;

SELECT
    order_id,
    CASE
        WHEN YEAR(order_date) = YEAR(NOW()) THEN 'Active'
        WHEN YEAR(order_date) = YEAR(NOW()) - 1 THEN 'Last Year'
        WHEN YEAR(order_date) < YEAR(NOW()) - 1 THEN 'Achived'
        ELSE 'Future'  
    END AS category
FROM orders

注意:

发现若分类准则不能囊括所有字段值,比如只写了今年和去年的两个分类条件,则不在这两个分类的记录的 category 字段值会赋值 null。

练习1

题目:

用两种方法得到包含如下字段的表:customer(将first_name和空格、last_name拼在一起), points, category(根据积分 <2k、2k~3k(包含两端)、>3k 分为青铜、白银和黄金用户)

-- 法一:case
USE sql_store;

SELECT
    CONCAT(first_name, ' ', last_name) AS customer,
    points,
    CASE
        WHEN points < 2000 THEN 'Bronze'
        WHEN points BETWEEN 2000 AND 3000 THEN 'Silver'
        WHEN points > 3000 THEN 'Gold'
        -- ELSE null
    END AS category
FROM customers
ORDER BY points DESC
-- 法二:IF嵌套
SELECT
    CONCAT(first_name, ' ', last_name) AS customer,
    points,
    IF(points < 2000, 'Bronze', 
        IF(points BETWEEN 2000 AND 3000, 'Silver', 
        -- 第二层的条件表达式也可以简化为 <= 3000
            IF(points > 3000, 'Gold', null))) AS category
FROM customers
ORDER BY points DESC

练习3

下面以菊花酱数据分析–某电商交易数据为例(goods_orders.csv)来学习CASE WHEN语法在数据查询中的几种常见用法。该数据集一共包含7个字段和5500条样本,这7个字段分别是用户ID、用户出生日期、下单时间、订单ID、支付方式、支付金额和是否享受折扣。

前置准备

# 可以使用图形化的方式导入数据集,预计需要1min时间能够完成5500条数据的导入
# 如果数据量大的话,建议使用命令行导入数据,比较节省时间
use test;
# 导入数据集goods_orders.csv
create table goods_orders(
Uid char(7),
Birthday date,
Order_Date datetime,
Order_Id varchar(15),
Pay_Type int,
Pay_Amt decimal(10,2),
Is_Discount int
);
# 将数据集放到安全路径下,然后导入数据库
load data infile "C:/ProgramData/MySQL/MySQL Server
8.0/Uploads/goods_orders.csv"
into table goods_orders
fields terminated by ','
lines terminated by '\n'
ignore 1 lines;
# 查看导入数据数量
select count(*) from goods_orders;
# 查看前10行数据
select * from goods_orders
limit 10;


image-20240211222806042

应用场景1:离散数值映射为对应的实际含义

在实际工作中,很多离散型字段值都是以数值的形式存储的,主要是这样可以节省数据的存储空间并且方便数据的查询。但是,缺点是没有办法根据每一个数字得知其背后的具体含义(通常情况下,会有一个数据字典对这些数字进行说明)。所以,我们可以利用case when语法在查询中实现数字值与实际含义的一一对应,例如

字段名称类别业务含义
Is_Discount0无折扣
Is_Discount1享受折扣
Pay_Type1,3,5,7,10微信支付
Pay_Type6,9,12银行卡支付
Pay_Type2,4,8,11支付宝支付

使用SQL语句实现数值与实际业务含义的一一对应:

select *,
	case
        when Is_Discount = 1 then "享受折扣"
        else "无折扣"
	end Discount_New,
	
	case
        when Pay_Type in (1,3,5,7,10) then "微信支付"
        when Pay_Type in (6,9,12) then "银行卡支付"
        else "支付宝支付"
	end Pay_Type_New
from goods_orders
limit 5

应用场景2:连续数值离散化

在做数据分析的时候,有时会需要把连续的数值切分为几种区间,比如,将用户的年龄切分为青年、中年、老年;收入可以切分为低收入群体、中等收入群体和高收入群体;根据用户的访问次数可以将用户分为不活跃用户、低活跃用户、次高活跃用户和高活跃用户等等。

对于我们的goods_orders数据集来说,我们可以根据用户的出生日期将用户划分为60后、70后、80后和90后

select *,
	case
		when year(Birthday) between 1960 and 1969 then "60后"
		when year(Birthday) between 1970 and 1979 then "70后"
		when year(Birthday) between 1980 and 1989 then "80后"
		else "90后"
	end Age_Group
from goods_orders
limit 5;

image-20240211223649046

应用场景3:行列转换

有时候我们经常会将行列进行转换,得到长形统计表和宽形统计表

长形统计表

统计2018年每个月各种支付方式的交易总额(长形统计表)

select month(Order_Date) as iMonth,
    case
        when Pay_Type in (1,3,5,7,10) then '微信支付'
        when Pay_Type in (6,9,12) then '银行卡支付'
        else '支付宝支付'
	end as iType,
sum(Pay_Amt) as Amt
from goods_orders
where year(Order_Date) = 2018
group by iMonth,iType;	

image-20240211224027619

  • 长形统计表 :统计结果显示,不论是月份iMonth还是支付方式iType ,它们每一种值均在表中出现多次,所以这种表就称为长形表,由于查询结果是基于分组统计所得,所以这种表也称为长形统计表
  • 宽形统计表 :构成宽形统计表的某一种或者某一类观测对象只能由一行组成,解决问题的思路就是将离散字段的水平值转换成具体的字段名名称

group by后面为什么可以使用别名?

前面我们说SQL语句的执行顺序是group by在select之前,那这里为什么在group by之后使用别名也可以查询出结果而没有报错?原因在于MySQL对查询做了加强处理,所以可以允许group by中使用别名,但是在其他的RDBMS中(比如Oracle)别名的使用都是严格遵循SQL执行顺序的——group by后面不能使用别名。

宽形统计表

统计2018年每个月各种支付方式的交易总额(宽形统计表)

select month(Order_Date) as iMonth,
    sum(case when Pay_Type in (1,3,5,7,10) then Pay_Amt end) as 'Wechat',
    sum(case when Pay_Type in (6,9,12) then Pay_Amt end) as 'Bank_Card',
    sum(case when Pay_Type not in (1,3,5,7,10,6,9,12) then Pay_Amt end) as
    'Ali_Pay'
from goods_orders
where year(Order_Date) = 2018
group by month(Order_Date)
order by month(Order_Date);

组成,解决问题的思路就是将离散字段的水平值转换成具体的字段名名称

group by后面为什么可以使用别名?

前面我们说SQL语句的执行顺序是group by在select之前,那这里为什么在group by之后使用别名也可以查询出结果而没有报错?原因在于MySQL对查询做了加强处理,所以可以允许group by中使用别名,但是在其他的RDBMS中(比如Oracle)别名的使用都是严格遵循SQL执行顺序的——group by后面不能使用别名。

宽形统计表

统计2018年每个月各种支付方式的交易总额(宽形统计表)

select month(Order_Date) as iMonth,
    sum(case when Pay_Type in (1,3,5,7,10) then Pay_Amt end) as 'Wechat',
    sum(case when Pay_Type in (6,9,12) then Pay_Amt end) as 'Bank_Card',
    sum(case when Pay_Type not in (1,3,5,7,10,6,9,12) then Pay_Amt end) as
    'Ali_Pay'
from goods_orders
where year(Order_Date) = 2018
group by month(Order_Date)
order by month(Order_Date);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值