1.数据库
1.1 概念
数据库是按照数据结构来存储、组织和管理数据的建立在计算机存储设备上的仓库。
1.2 分类
- 网络数据库
- 层级数据库
- 关系数据库
1.3 关系型数据库
是建立在关系模型基础上的数据库。
关系模型是由数据结构、操作集合、关系完整性约束三部分组成。
1.3.1 典型关系型数据库
- 小型:Microsoft Access、SQLite
- 中型:SQL Server、Mysql
- 大型:Oracle、DB2
2.SQL
2.1 简介
结构化查询语言
2.2 分类
- 数据定义语言(DDL):定义了不同的数据库、表、视图、索引等数据库对象,还可以用来创建、副除.修改数据库和数据表的结构。
- 主要的语句关键字包括CREATE、DROP、 ALTER、RENAME、TRUNCATE等。
- 数据操作语言(DML):用于添加、删除、更新和查询数据库记录,并检查数据完整性。
- 主要的语句关键字包括INSERT、DELETE、 UPDATE、SELECT等。
- 数据控制语言(DCL):用于定义数据库、表、字段、用户的访问权限和安全级别。
- 主要的语句关键字包括GRANT、REVOKE、COMMIT 、 ROLLBACK、SAVEPOINT等。
2.3 SQL语言的规则和规范
2.3.1 基本规则
- SQL可以写在一行或者多行。为了提高可读性,各子句分行写,必要时使用缩进。
- 每条命令以;或\g或\G结束。
- 关键字不能被缩写也不能分行。
- 关于标点符号:
- 必须保证所有的()、单引号、双引号是成对结束的。
- 必须使用英文状态下的半角输入方式。
- 字符串型和日期时间类型的数据使用单引号(")表示。
- 列的别名,尽量使用双引号(" "),而且不建议省略as。
2.3.2 基本规范
- MySQL在windows环境下是大小写不敏感的。
- MySQL在 Linux环境下是大小写敏感的。
- 数据库名、表名、表的别名、变量名是严格区分大小写的。
- 关键字、函数名、列名(或字段名)、列的别名(字段的别名)是忽略大小写的。
- 推荐采用统一的书写规范:
- 数据库名、表名、表别名、字段名、字段别名等都小写。
- SQL 关键字、函数名、绑定变量等都大写。
2.3.3 注释
可以使用如下格式的注释结构:
- 单行注释:# 文字(MySQL特有)
- 单行注释:-- 文字(–后必须包含一个空格)
- 多行注释:/* 文字 */
3.基础的SELECT语句
3.1 导入现有数据表
- 命令行:source 文件的全路径名。
- 基于数据库工具。
3.2 SELECT…FROM
SELECT 字段1,字段2,... FROM 表名;
3.3 列的别名
- as:全称为alias,可以省略。
SELECT 字段1 AS 字段1的别名,字段2 AS 字段2的别名,... FROM 表名;
- 列的别名可以使用一对""引起来。
SELECT 字段1 "字段1的别名",字段2 "字段2的别名",... FROM 表名;
3.4 去除重复行
加入DISTINCT关键字即可。
SELECT DISTINCT department_id FROM employees;
3.4 空值(null)参与运算
所有运算符或列值遇到null值,运算结果都为null。
注意:null不等同于0,‘’,‘null’。
3.5 着重号:``
为了避免字段没有和保留字、数据库系统或常用方法冲突,而将会发生冲突的字段使用``引起来。
SELECT * FROM
order;
3.6 查询常数
SELECT 'cherish',employee_id FROM employees;
3.7 过滤数据
使用WHERE过滤数据,声明在FROM结构的后面。
SELECT * FROM employees WHERE department_id = 90;
3.8 显示表结构
显示表中所含的字段信息:
- describe 表名;
DESCRIBE/DESC employees;
- desc 表名;
- show columns from 表名;
show columns from employees;
4.运算符
4.1 算术运算符
- +没有连接的作用,表示加法运算。此时会将字符串转换为数值(隐式转换)如果转换数值不成功,则看做0。
- 除法运算中分母为0,结果为null。
- 取模运算结果与被模数的符号一致。
4.2 比较运算符
比较运算符经常被用来作为SELECT查询语句的条件来使用,返回符合条件的结果记录。比较的结果为真返回1,为假返回0,其他情况返回null。
4.2.1 符号类型运算符
=、<=>、<>、!=、<、<=、>、>=
- =:
- 两边都是字符串,则按照ANSI的比较规则进行比较。
- 只要有null参与比较,结果就为null。
- <=>可以对NULL进行判断:当两边都是null时,其返回值为1。
- <>:表示不等于。
4.2.2 非符号类型运算符
- IS NULL、ISNULL函数
- IS NOT NULL
- LEAST函数
- GREATEST函数
- BETWEEN AND:包括左右的边界值,右边的边界值必须大于等于左边的边界值。
- IN:后跟集合。
SELECT last_name,salary FROM employees WHERE department_id IN (10,20,30);
- NOT IN:后跟集合。
- LIKE:模糊查询
- %:代表不确定个数的字符(0、1或多个)。
- _:代表一个不确定的字符;若查询的条件中存在下划线则使用转义字符即可。
- REGEXP:用来匹配字符串,语法格式为expr REGEXP 匹配条件。如果expr满足匹配条件则返回1;不满足返回0。若expr或匹配条件任意一个为null,则返回null。
- ‘^’:匹配以该字符后面的字符开头的字符串
- ‘$’ :匹配以该字符前面的字符结尾的字符串
- ‘_’:匹配任何一个单字符
- “[…]”:匹配在方括号内的任何字符
- ‘*’:匹配零个或多个在它前面的字符
- RLIKE
4.3 逻辑运算符
AND/&&、OR/||、NOT/!、XOR
4.4 位运算符
是在二进制数上进行计算,然后将结果从二进制数转换回十进制数。
&、|、^、~、>>、<<
5.排序与分页
5.1 排序
5.1.1 排序规则
- 使用ORDER BY子句排序:
- ASC升序
- DESC降序
- ORDER BY子句在SELECT语句的结尾。
- 如果在ORDER BY后没有显式指明排序方式,则默认按照升序排序。
5.1.2 单列排序
SELECT employee_id,salary FROM employees ORDER BY department_id DESC;
5.1.3 多列排序
SELECT employee_id,salary FROM employees ORDER BY department_id DESC,salary ASC;
5.2 分页
5.2.1 背景
- 查询返回的结果过多不方便查看。
- 需要显示表中指定条的数据。
5.2.2 实现规则
- 使用LIMIT实现数据的分页操作。
- 每页显示pageSize条数据,此时显示第pageNo页:LIMIT (pageNo-1)*pageSize,pageSize;
- MySQL8.0新特性:LIMIT…OFFSET…。
- LIMIT必须放到SELECT语句的最后。
SELECT employee_id,last_name,salary FROM employees ORDER BY salary DESC LIMIT 1 OFFSET 0;
6.多表查询
6.1 介绍
多表查询也称关联查询,指的是两个或更多个表一起完成查询操作。
6.1 实现方式
多表查询的正确方式:需要有连接条件:
- 两个表的连接操作:
SELECT employees.employee_id,departments.department_name FROM employees,departments WHERE employees.department_id=departments.department_id;
- 如果查询语句中出现了多个表中都存在的字段,则必须指明此字段所在的表。
- 从sql优化的角度,建议多表查询时,每个字段前都指明其所在的表。
- 若查询语句过长,可以给表起别名,在SELECT和WHERE中使用表的别名。
SELECT emp.employee_id,dept.department_name FROM employees emp,departments dept WHERE emp.department_id=dept.department_id;
- 三表查询:
SELECT e.employee_id,e.last_name,d.department_name,l.city FROM employees e,departments d,locations l WHERE e.department_id=d.department_id AND d.location_id=l.location_id;
- 如果有n个表需要实现多表查询,则至少需要n-1个连接条件。
6.3 分类
6.3.1 等值和非等值连接
- 非等值连接:
SELECT e.last_name,e.salary,j.grade_level FROM employees e,job_grades j WHERE e.salary BETWEEN j.lowest_sal AND j.highest_sal;
- 等值连接:
SELECT emp.employee_id,dept.department_name FROM employees emp,departments dept WHERE emp.department_id=dept.department_id;
6.3.2 自连接和非自连接
- 自连接:
SELECT emp.employee_id,emp.last_name,mgr.employee_id,mgr.last_name FROM employees emp,employees mgr WHERE emp.manager_id=mgr.employee_id;
6.3.3 内连接和外连接
- 内连接:合并具有同一列的两个以上的表的行,结果集中不包含一个表与另一个表不匹配的行。
SELECT e.employee_id,d.department_name FROM employees e JOIN departments d ON e.department_id=d.department_id;
SELECT e.employee_id, e.last_name, d.department_name, l.city FROM employees e JOIN departments d ON e.department_id = d.department_id JOIN locations l ON d.location_id = l.location_id;
- 外连接:合并具有同一列的两个以上的表的行,结果集中除了包含一个表与另一个表匹配的行之外,还查询到了左表或右表中不匹配的行。外连接进一步可分为:
- 左外连接:两个表在连接过程中除了返回满足连接条件的行之外还返回左表中不满足条件的行。
SELECT e.last_name, d.department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id;
- 右外连接:两个表在连接过程中除了返回满足连接条件的行之外还返回右表中不满足条件的行。
-SELECT e.last_name, d.department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id;
- 满外连接:两个表在连接过程中除了返回满足连接条件的行之外还返回右表中不满足条件的行。
- 左外连接:两个表在连接过程中除了返回满足连接条件的行之外还返回左表中不满足条件的行。
- SQL99语法中使用JOIN…ON的方式来实现多表查询。这种方式可以解决外连接问题(推荐使用)。
6.4 UNION的使用
合并查询结果,即利用UNION关键字,可以给出多条SELECT语句,并将它们的结果组合成单个结果集,合并时,两个表对应的列数和数据类型必须相同且相互对应。各个SELECT语句之间使用UNION或UNION ALL分隔。
注意:执行UNION ALL语句时所需要的资源比UNION语句少。如果明确知道合并数据后的结果数据不存在重复数据,或者不需要去除重复的数据,则尽量使用UNION ALL语句,以提高数据查询的效率。
6.4.1 UNION
返回两个查询结果集的并集,去除重复记录。
6.4.2 UNION ALL
返回两个查询结果集的并集,不去除重复记录。
6.5 7种SQL JOINS实现方式
6.5.1 中图:内连接
SELECT e.employee_id, d.department_name FROM employees e JOIN departments d ON e.department_id = d.department_id;
6.5.2 左上图:左外连接
SELECT e.employee_id, d.department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id;
6.5.3 右上图:右外连接
SELECT e.employee_id, d.department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id;
6.5.4 左中图
SELECT e.employee_id, d.department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id WHERE d.department_id IS NULL;
6.5.5 右中图
SELECT e.employee_id, d.department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id WHERE e.department_id IS NULL;
6.5.6 左下图
- 左上图 UNION ALL 右中图
SELECT employee_id, department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id UNION ALL SELECT employee_id, department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id WHERE e.department_id IS NULL;
- 左中图 UNION ALL 右上图
SELECT employee_id, department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id WHERE d.department_id IS NULL UNION ALL SELECT employee_id, department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id;
6.5.7 右下图
左中图 UNION ALL 右中图
SELECT e.employee_id, d.department_name FROM employees e LEFT JOIN departments d ON e.department_id = d.department_id WHERE d.department_id IS NULL UNION ALL SELECT e.employee_id, d.department_name FROM employees e RIGHT JOIN departments d ON e.department_id = d.department_id WHERE e.department_id IS NULL;
6.6 SQL99新特性
6.6.1 自然连接
使用NATURAL JOIN表示自然连接,可以理解为SQL92中的等值连接。它会自动查询两张连接表中所有相同的字段,然后进行等值连接。
SELECT employee_id,last_name,department_name FROM employees e NATURAL JOIN departments d;
6.6.2 USING连接
支持使用USING替换WHERE之后的内容,USING指定了具体的相同字段名称,需要在USING后的括号中填入要指定的同名字段。
SELECT employee_id,last_name,department_name FROM employees e JOIN departments d USING (department_id);
7.单行函数
7.1 介绍
- 操作数据对象
- 接收参数返回一个结果
- 只对一行进行变换
- 每行返回一个结果
- 可以嵌套
- 参数可以是一列或一个值
7.2 数值函数
7.2.1 基本函数
- ABS(x):返回x的绝对值。
- SIGN(X):返回x的符号。正数返回1,负数返回-1,0返回0。
- Pl():返回圆周率的值。
- CEIL(x),CEILING(x):返回大于或等于某个值的最小整数。
- FLOOR(x):返回小于或等于某个值的最大整数。
- LEAST(e1,e2,e3…):返回列表中的最小值。
- GREATEST(e1,e2,e3…):返回列表中的最大值。
- MOD(x.y):返回x除以Y后的余数。
- RAND():返回0~1的随机值。
- RAND(x):返回0~1的随机值,其中x的值用作种子值,相同的X值会产生相同的随机数。
- ROUND(x):返回一个对x的值进行四舍五入后,最接近于x的整数。
- ROUND(x,y):返回一个对x的值进行四舍五入后最接近x的值,并保留到小数点后面Y位。
- TRUNCATE(x,y):返回数字x截断为y位小数的结果。
- sQRT(x):返回x的平方根。当x的值为负数时,返回NULL。
7.2.2 角度与弧度互换函数
- RADIANS(x):将角度转化为弧度,其中,参数x为角度值。
- DEGREES(x):将弧度转化为角度,其中,参数x为弧度值。
7.2.3 三角函数
- SIN(x):返回x的正弦值,其中,参数x为弧度值。
- ASIN(x):返回x的反正弦值,即获取正弦为x的值。如果x的值不在-1到1之间,则返回NULL。
- cos(x):返回x的余弦值,其中,参数x为弧度值。
- ACOS(x):返回x的反余弦值,即获取余弦为x的值。如果x的值不在-1到1之间,则返回NULL。
- TAN(x):返回x的正切值,其中,参数x为弧度值。
- ATAN(x):返回x的反正切值,即返回正切值为x的值。
- ATAN2(m,n):返回两个参数的反正切值。
- COT(x):返回x的余切值,其中,x为弧度值。
7.2.4 指数和对数函数
- POW(x,y),POWER(X,Y):返回x的y次方。
- EXP(X):返回e的X次方,其中e是一个常数2.718281828459045。
- LN(X),LOG(X):返回以e为底的x的对数,当X<=0时,返回的结果为NULL。
- LOG10(X):返回以10为底的x的对数,当X<=0时,返回的结果为NULL。
- LOG2(X):返回以2为底的x的对数,当X<= 0时,返回NULL。
7.2.5 进制间的转换
- BIN(x):返回:x的二进制编码。
- HEX(x):返回x的十六进制编码。
- OCT(x):返回x的八进制编码。
- CONV(x,f1,f2):返回f1进制数变成f2进制数。
7.3 字符串函数
- ASCII(S):返回字符串s中的第一个字符的ASCII码值。
- CHAR_LENGTH(s):返回字符串s的字符数。作用与CHARACTER_LENGTH(s)相同。
- LENGTH(s):返回字符串s的字节数,和字符集有关。
- CONCAT(s1,s2…sn),连接s1,s2…sn为一个字符串。
- CONCAT_WS(x,s1,s2…sn):同CONCAT(s1,s2…sn)函数,但是每个字符串之间要加上x。
- INSERT(str, idx, len,replacestr):将字符串str从第idx位置开始,len个字符长的子串替换为字符串replacestr。注意:字符串的索引从1开始。
- REPLACE(str, a, b):用字符串b替换字符串str中所有出现的字符串a。
- UPPER(s)或UCASE(s):将字符串s的所有字母转成大写字母。
- LOWER(s)或LCASE(s):将字符串s的所有字母转成小写字母。
- LEFT(str,n):返回字符串str最左边的n个字符。
- RIGHT(str,n):返回字符串str最右边的n个字符。
- LPAD(str, len, pad):用字符串pad对str最左边进行填充,直到str的长度为len个字符。可以实现右对齐。
- RPAD(str ,len, pad):用字符串pad对str最右边进行填充,直到str的长度为len个字符。可以实现左对齐。
- LTRIM(S):去掉字符串s左侧的空格。
- RTRIM(s):去掉字符串s右侧的空格。
- TRIM(s):去掉字符串s开始与结尾的空格。
- TRIM(s1 FROM s):去掉字符串s开始与结尾的s1。
- TRIM(LEADING s1 FROM s):去掉字符串s开始处的s1。
- TRIM(TRAILING s1 FROM s):去掉字符串s结尾处的s1。
- REPEAT(str, n):返回str重复n次的结果。
- SPACE(n):返回n个空格。
- STRCMP(s1,s2):比较字符串s1,s2的ASCII码值的大小。
- SUBSTR(s,index,len):返回从字符串s的index位置其len个字符,作用与SUBSTRING(s,n,len)、MID(s,n,len)相同。
- LOCATE(substr,str):返回字符串substr在字符串str中首次出现的位置,作用于POSITION(substr lN str)、INSTR(str.substr)相同。未找到,返回0。
- ELT(m,s1,s2,…,sn):返回指定位置的字符串,如果m=1,则返回s1,如果m=2,则返回s2,如果m=n,则返回sn。
- FIELD(s,s1,s2…sn):返回字符串s在字符串列表中第一次出现的位置。
- FIND_IN_SET(s1,s2):返回字符串s1在字符串s2中出现的位置。其中,字符串s2是一个以逗号分隔的字符串。
- REVERSE (s):返回s反转后的字符串。
- NULLIF(value1,value2):比较两个字符串,如果value1与value2相等,则返回NULL,否则返回value1。
7.4 日期时间函数
7.4.1 获取日期、时间
- CURDATE(),CURRENT_DATE():返回当前日期,只包含年、月、日。
- CURTIME(), CURRENT_TIME():返回当前时间,只包含时、分、秒。
- Now() / SYSDATE() / CURRENT_TIMESTAMP() / LOCALTIME() / LOCALTIMESTAMP():返回当前系统日期和时间。
- UTC_DATE():返回UTC(世界标准时间)曰期。
- UTC_TIME():返回UTC(世界标准时间)时间。
7.4.2 日期与时间戳的转换
- UNIX_TIMESTAMP():以UNIX时间戳的形式返回当前时间。SELECT UNIX_TIMESTAMP()->1634348854。
- UNIX_TIMESTAMP(date):将时间date以UNIX时间戳的形式返回。
- FROM_UNIXTIME(timestamp):将UNIX时间戳的时间转换为普通格式的时间。
7.4.3 获取月份、星期、星期数、天数等函数
- YEAR(date) / MONTH(date)/DAY(date):返回具体的日期值。
- HOUR(time) / MINUTE(time) / SECOND(time):返回具体的时间值。
- MONTHNAME(date):返回月份: January,…。
- DAYNAME(date):返回星期几: MONDAY,TUESDAY…SUNDAY。
- WEEKDAY(date):返回周几,注意,周1是0,周2是1,。。。周日是6。
- QUARTER(date):返回日期对应的季度,范围为1~4。
- WEEK(date), WEEKOFYEAR(date):返回一年中的第几周。
- DAYOFYEAR(date):返回日期是一年中的第几天。
- DAYOFMONTH(date):返回日期位于所在月份的第几天。
- DAYOFWEEK(date):返回周几,注意:周日是1,周一是2,。。。周六是7。
7.4.4 日期的操作函数
EXTRACT (type FROM date):返回指定日期中特定的部分,type指定返回的值。
取值 | 含义 |
---|---|
MICROSECOND | 返回毫秒数 |
SECOND | 返回秒数 |
MINUTE | 返回分钟数 |
HOUR | 返回小时数 |
DAY | 返回天数 |
WEEK | 返回日期在一年中的第几个星期 |
MONTH | 返回日期在一年中的第几个月 |
QUARTER | 返回日期在一年中的第几个季度 |
YEAR | 返回日期的年份 |
SECOND_MICROSECOND | 返回秒和毫秒值 |
MINUTE_MICROSECOND | 返回分钟和毫秒值 |
HOUR_MICROSECOND | 返回小时和毫秒值 |
HOUR_SECOND | 返回小时和秒值 |
HOUR_MINUTE | 返回小时和分钟值 |
DAY_MICROSECOND | 返回天和毫秒值 |
DAY_SECOND | 返回天和秒值 |
DAY_MINUTE | 返回天和分钟值 |
DAY_HOUR | 返回天和小时 |
YEAR_MONTH | 返回年和月 |
7.4.5 时间和秒钟的转换函数
- TIME_TO_SEC(time):将time转化为秒并返回结果值。转化的公式为:小时3600+分钟60+秒。
- SEC_TO_TIME(second):将seconds描述转化为包含小时、分钟和秒的时间。
7.4.6 计算日期和时间的函数
- DATE_ADD(idatetime, INTERVAL expr type) ,ADDDATE(date,INTERVAL expr type):返回与给定日期时间相差INTERVAL时间段的日期时间。
- DATE_SUB(date,INTERVAL expr type),SUBDATE(date,lNTERVAL expr type):返回与date相差INTERVAL时间间隔的日期。
- ADDTIME(time1,time2):返回time1加上time2的时间。当time2为一个数字时,代表的是秒,可以为负数。
- SUBTIME(time1,time2):返回time1减去time2后的时间。当time2为一个数字时,代表的是秒,可以为负数。
- DATEDIFF(date1,date2):返回date1- date2的日期间隔天数。
- TIMEDIFF(time1, time2):返回time1 -time2的时间间隔。
- FROM_DAYS(N):返回从0000年1月1日起,N天以后的日期。
- TO_DAYS(date):返回日期date距离0000年1月1日的天数。
- LAST_DAY(date):返回date所在月份的最后一天的日期。
- MAKEDATE(year,n):针对给定年份与所在年份中的天数返回一个日期。
- MAKETIME(hour,minute,second):将给定的小时、分钟和秒组合成时间并返回。
- PERIOD_ADD(time,n):返回time加上n后的时间。
7.4.7 日期的格式化和解析
- 格式化:日期转为字符串
- DATE_FORMAT(date,fmt):按照字符串fmt格式化日期date值。
- TIME_FORMAT(time,fmt):按照字符串fmt格式化时间time值。
- 解析:字符串转换为日期
- STR_TO_DATE(str, fmt):按照字符串fmt对str进行解析,解析为一个日期。
- fmt常用的格式:
符号 | 含义 | 符号 | 含义 |
---|---|---|---|
%Y | 4位数字表示年份 | %y | 表示两位数字表示年份 |
%M | 月名表示月份(January) | %m | 两位数字表示月份01 |
%b | 缩写的月名Jan | %c | 数字表示月份1 |
%D | 英文后缀表示月中的天数1st | %d | 两位数字表示月中的天数01 |
%e | 数字形式表示月中的天数1 |
- GET_FORMAT(date_type,format_type):返回日期字符串的显示格式。其中date_type和format_type参数取值如下:
7.5 流程控制函数
流程处理函数可以根据不同的条件,执行不同的处理流程,可以在SQL语句中实现不同的条件选择。MySQL中的流程处理函数主要包括IF()、IFNULL()和CASE()函数。
7.6 加密和解密函数
加密与解密函数主要用于对数据库中的数据进行加密和解密处理,以防止数据被他人窃取。这些函数在保证数据库安全时非常有用。
7.7 MySQL信息函数
MySQL中内置了一些可以查询MySQL信息的函数,这些函数主要用于帮助数据库开发或运维人员更好地对数据库进行维护工作。