文章目录
模式定义了数据如何存储、存储什么样的数据以及数据如何分解等信息,数据库和表都有模式。
数据库的创建与使用
CREATE DATABASE test;
USE test;
创建表
主键的值不允许修改,也不允许复用(不能使用已经删除的主键值赋给新数据行的主键)。
CREATE TABLE mytable(
id INT NOT NULL AUTO_INCREMENT,
col1 INT NOT NULL DEFAULT 1,
col2 VARCHAR(45) NULL,
col3 DATE NULL,
PRIMARY KEY('id'));
修改表
添加列
ALTER TABLE mytable
ADD col CHAR(20);
删除列
ALTER TABLE mytable
DROP COLUMN col;
删除表
DROP TABLE mytable;
插入
普通插入
INSERT INTO mytable(col1,col2)
VALUES(val1,val2);
插入检索出来的数据
INSERT INTO mytable1(col1,col2)
SELECT col1,col2
FROM mytable2;
将一个表的内容插入到一个新表
CREATE TABLE newtable AS
SELETE * FROM mytable;
更新
UPDATE mytable
SET col=val
WHERE id=1;
删除
DELETE FROM mytable
WHERE id=1;
TRUNCATE TABLE
可以清空表,也就是删除所有行。
TRUNCATE TABLE mytable;
使用更新和删除操作时一定要用到WHERE子句,不然会把整张表的数据都破坏。可以先用SELETE语句进行测试,防止错误删除。
查询
DISTINCT
相同值只会出现一次。他作用与所有列,也就是说所有列的值都相同才算相同。
SELECT DISTINCT col1,col2
FROM mytable;
LIMIT
限制返回的行数。可以有两个参数,第一个参数为起始行,从0开始;第二个参数为返回的总行数。
返回前5行:
SELECT *
FROM mytable
LIMIT 5;
SELECT *
FROM mytable
LIMIT 0,5;
返回3-5行:
SELECT *
FROM mytable
LIMIT 2,3;
排序
- ASC:升序(默认)
- DESC:降序
可以按多个列进行排序,并且为每个列指定不同的排序方式:
SELECT *
FROM mytable
ORDER BY col1 DESC,col2 ASC;
过滤
不进行过滤的数据非常大,导致通过网络传输了多余数据,从而浪费了网络带宽。因此尽量使用SQL语句来过滤不必要的数据,而不是传输所有的数据到客户端中然后由客户端进行过滤。
SELECT *
FROM mytable
WHERE col IS NULL;
IN操作符用于匹配一组值,其后也可以接一个SELECT子句,从而匹配子查询得到的一组值。
通配符
通配符也是用在过滤语句中,但它只能用于文本字段。
%
:匹配>=0个任意字符_
:匹配==1个任意字符[]
:匹配集合内的字符,例如[ab]将匹配字符a或者b,用脱字符^可以对其进行否定,也就是不匹配集合内的字符。
使用Like
来进行通配符匹配:
不以A和B开头的任意文本:
SELECT *
FROM mytable
WHERE col LIKE ‘[^AB]%’;
不要滥用通配符,通配符位于开头处匹配会非常慢。
计算字段
在数据库服务器上完成数据的转换和格式化的工作往往比客户端上快的多,并且转换和格式化后的数据量更少的话可以减少网络通信量。
计算字段通常需要使用AS来取别名,否则输出的时候字段名为计算表达式。
SELECT col1 * col2 AS alias
FROM mytable;
CONCAT()用于连接两个字段。许多数据库会使用空格把一个值填充为列宽,因此连接的结果会出现一些不必要的空格,使用**TRIM()**可以去除收尾空格。
SELECT CONCAT(TRIM(col1),'(',TRIM(col2),')') AS concat_col
FROM mytable;
函数
各个DBMS的函数是不相同的,因此不可移植,以下主要是MySQL的函数。
使用DISTINCT
可以让汇总函数值汇总不同的值。
SELECT AVG(DISTINCT col1) AS avg_col
FROM mytable;
文本处理
其中,SOUNDEX()
可以将一个字符串转换为描述其语音表示的字母数字模式。
SELECT *
FROM mytable
WHERE SOUNDEX(col1)=SOUNDEX('apple');
日期和时间处理
- 日期格式: YYYY-MM-DD
- 时间格式: HH:MM:SS
mysql>SELECT NOW();
2021-5-25 19:17:30
数值处理
分组
分组就是把具有相同的数据值的行放到同一组中。
可以对同一分组数据使用汇总函数进行处理,例如求分组数据的平均值等。
指定的分组字段除了能按该字段进行分组,也会自动按字段进行排序。
SELECT col,COUNT(*) AS num
FROM mytable
GROUP BY col;
GROUP BY
自动按分组字段进行排序,ORDER BY
也可以按汇总字段来进行排序。
SELECT col, COUNT(*) AS num
FROM mytable
GROUP BY col
ORDER BY num;
WHERE
过滤行,HAVING
过滤分组,行过滤应当先于分组过滤。
SELECT col, COUNT(*) AS num
FROM mytable
WHERE col > 2
GROUP BY col
HAVING num >= 2;
分组规定:
- GROUP BY子句出现在WHERE子句之后,ORDER BY子句之前。
- 除了汇总字段外,SELECT语句中的每一个字段都必须在GROUP BY子句中给出。
- NULL的行会单独分为一组
- 大多数SQL实现不支持GROUP BY列具有可变长度的数据类型。
子查询
子查询中只能返回一个字段的数据。
可以将子查询的结果作为WHERE语句的过滤条件:
SELECT *
FROM mytable1
WHERE col1 IN (SELECT col2
FROM mytable2);
下面的语句可以检索出客户的订单数量,子查询语句会对第一个查询检索出的每个客户执行一次:
SELECT cust_name, (SELECT COUNT(*)
FROM Orders
WHERE Orders.cust_id = Customers.cust_id)
AS orders_num
FROM Customers
ORDER BY cust_name;
连接
连接用于连接多个表,使用JOIN
连接字,并且条件语句使用ON
而不是WHERE
.
连接可以替换子查询,并且比子查询的效率一般会更快。
可以用AS
给列名、计算字段和表名取别名,给表名取别名是为了简化SQL语句以及连接相同表。
内连接
又称为等值连接,使用INNER JOIN
关键字。
SELECT A.value, B.value
FROM tablea AS A INNER JOIN tableb AS B
ON A.key = B.key;
可以不明确使用INNER JOIN
,而使用普通查询在WHERE中将两个表中要连接的列用等值方法连接起来。
SELECT A.value, B.value
FROM tablea AS A, tableb AS B
WHERE A.key = B.key;
自连接
自连接可以看做内连接的一种,只是连接的表是自身而已。
一张员工表,包含员工姓名和员工所属部门,要找出与 Jim 处在同一部门的所有员工姓名。
子查询版本
SELECT name
FROM employee
WHERE department = (
SELECT department
FROM employee
WHERE name = "Jim");
自连接版本
SELECT e1.name
FROM employee AS e1 INNER JOIN employee AS e2
ON e1.department = e2.department
AND e2.name = "Jim";
自然连接
自然连接是把同名列通过等值测试连接起来的,同名列可以有多个。
内连接和自然连接的区别:
内连接提供连接的列,而自然连接自动连接所有同名列。
SELECT A.value, B.value
FROM tablea AS A NATURAL JOIN tableb AS B;
外连接
外连接保留了没有关联的那些行。分为左外连接、右外连接以及全外连接,左外连接就是保留左表没有关联的行。
检索所有顾客的订单信息,包括还没有订单信息的顾客。
SELECT Customers.cust_id, Orders.order_num
FROM Customers LEFT OUTER JOIN Orders
ON Customers.cust_id = Orders.cust_id;
组合查询
使用 UNION
来组合两个查询,如果第一个查询返回 M 行,第二个查询返回 N 行,那么组合查询的结果一般为 M+N 行。
每个查询必须包含相同的列、表达式和聚集函数。
默认会去除相同行,如果需要保留向同行,使用UNION ALL
。
只能包含一个ORDER BY
子句,并且必须位于语句的最后。
SELECT col
FROM mytable
WHERE col = 1
UNION
SELECT col
FROM mytable
WHERE col =2;
视图
视图是虚拟的表,本身不包含数据,也就不能对其进行索引操作。
对视图的操作和对普通表的操作一样。
视图具有以下好处:
- 简化复杂的SQL操作,比如复杂的连接。
- 只使用实际表的一部分数据
- 通过只给用户访问视图的权限,保证数据的安全性
- 更改数据格式和表示
CREATE VIEW myview AS
SELECT Concat(col1, col2) AS concat_col, col3*col4 AS compute_col
FROM mytable
WHERE col5 = val;
存储过程
存储过程可以看成是对一系列SQL操作的批处理。
使用存储过程的好处:
- 代码封装,保证了一定的安全性
- 代码复用
- 由于是预先编译,因此具有很高的性能
命令行中创建存储过程需要自定义分隔符,因为命令是以;
为结束符,而存储过程中也包含了分号,因此会错误把这部分分号当做是结束符,造成语法错误。
包含in、out、inout
三种参数。
给变量赋值都需要用select into
语句。
每次只能给一个变量赋值,不支持集合的操作。
delimiter //
create procedure myprocedure( out ret int )
begin
declare y int;
select sum(col1)
from mytable
into y;
select y*y into ret;
end //
delimiter ;
call myprocedure(@ret);
select @ret;
游标
在存储过程中使用游标可以对一个结果集进行移动遍历。
游标主要用于交互式应用,其中用户需要对数据集中的任意行进行浏览和修改。
使用游标的四个步骤:
- 声明游标,这个过程没有实际检索出数据
- 打开游标
- 取出数据
- 关闭游标
delimiter //
create procedure myprocedure(out ret int)
begin
declare done boolean default 0;
declare mycursor cursor for
select col1 from mytable;
# 定义了一个 continue handler,当 sqlstate '02000' 这个条件出现时,会执行 set done = 1
declare continue handler for sqlstate '02000' set done = 1;
open mycursor;
repeat
fetch mycursor into ret;
select ret;
until done end repeat;
close mycursor;
end //
delimiter ;
触发器
触发器会在某个表执行以下语句时而自动执行:DELETE、INSERT、UPDATE
触发器必须指定在语句执行之前还是之后自动执行,之前执行使用BEFORE
关键字,之后执行使用AFTER
关键字。BEFORE
用于数据验证和净化,AFTER
用于审计跟踪,就修改记录到另一张表中。
INSERT触发器
包含一个名为NEW的虚拟表。
CREATE TRIGGER mytrigger AFTER INSERT ON mytable
FOR EACH ROW SELECT NEW.col into @result;
SELECT @result; -- 获取结果
DELETE触发器
包含一个名为OLD的虚拟表,并且是只读的。
UPDATE触发器
包含一个名为NEW和一个名为OLD的虚拟表,其中NEW是可以被修改的,而OLD是只读的。
MySQL不允许在触发器中使用CALL语句,也就是不能让调用存储过程。
事务管理
- 事务:一组SQL语句。
- 回退:撤销指定SQL语句的过程
- 提交:将未存储的SQL语句结果写入到数据库表
- 保留点:事务处理中设置的临时占位符,你可以对它发布回退(与回退整个事务处理不同)
不能回退SELECT语句,回退SELECT语句也没有意义;也不能回退CREATE和DROP语句。
MySQL的事务提交默认是隐式提交,每执行一条语句就把这条语句当成一个事务然后进行提交。当出现START TRANSACTION
会关闭隐式提交;当COMMIT或ROLLBACK语句执行后,事务会自动关闭,重新恢复隐式提交。
通过设置autocommit
为0可以取消自动提交;autocommit
标记是针对每个连接而不是针对服务器的。
如果没有设置保留点,ROLLBACK会回退到START TRANSACTION
语句处;如果设置了保留点,并且在ROLLBACK中指定了保留点,那么就会回退到保留点。
权限管理
MySQL的账户信息保存在mysql这个数据库中。
USE mysql;
SELECT user FROM user;
创建账户
新创建的账户没有任何权限:
CREATE USER myuser IDENTIFIED BY 'mypassword';
修改账户名
RENAME myuser TO newuser;
删除账户
DROP USER myuser;
查看权限
SHOW GRANTS FOR myuser;
授予权限
账户用 username@host 的形式定义,username@% 使用的是默认主机名。
GRANT SELECT, INSERT ON mydatabase.* TO myuser;
删除权限
GRANT 和 REVOKE 可在几个层次上控制访问权限:
- 整个服务器,使用 GRANT ALL 和 REVOKE ALL;
- 整个数据库,使用 ON database.*;
- 特定的表,使用 ON database.table;
- 特定的列;
- 特定的存储过程。
REVOKE SELECT, INSERT ON mydatabase.* FROM myuser;
更改密码
必须使用Password()
函数
SET PASSWROD FOR myuser = Password('new_password');
字符集
- 字符集:字符和符号的集合
- 编码:为某个字符集成员的内部表示
- 校对字符:指定如何比较,主要用于排序和分组。
除了给指定字符集和校对外,也可以给列指定:
CREATE TABLE mytable
(col VARCHAR(10) CHARACTER SET latin COLLATE latin1_general_ci )
DEFAULT CHARACTER SET hebrew COLLATE hebrew_general_ci;
可以在排序、分组时指定校对:
SELECT *
FROM mytable
ORDER BY col COLLATE latin1_general_ci;