MySql学习笔记

yjh_________

已于 2023-08-09 14:49:14 修改

阅读量142

点赞数

文章标签： mysql 学习笔记

于 2023-06-13 17:40:00 首次发布

本文链接：https://blog.csdn.net/yjh_________/article/details/131181338

版权

一、单表查询

1、什么是数据库？什么是数据库管理系统？什么是SQL？它们之间的关系是什么？

数据库（DataBase）是按照一定格式存储数据的一些文件的组合。数据存储的仓库，实际上就是一堆文件，这些文件中存储了具有特定格式的数据。

数据库管理系统（DataBaseManagement）是专门用来管理数据库中文件的，数据库管理系统可以对数据库中数据进行增删改查。常见的数据库管理系统：MySQL、Oracle等

SQL（Structured Query Language）是结构化查询语言，程序员通过编写SQL语句，然后DBMS负责执行SQL语句，最终来完成数据库中数据的CRUD。

三者关系：DBMS--执行-->SQL-->操作-->DB

2、端口号和IP地址

端口号port是任何一个软件/应用都会有的，端口号是应用的唯一代表。端口号通常和IP地址在一块，IP地址用来定位计算机的，端口号是用来定位计算机上某个服务的/某个应用的。在通体态计算机上，端口号不能重复，具有唯一性

3、什么是表，为什么数据库用表存储数据？

数据库当中是以表格的形式表示数据的，因为表比较直观

表是一种存储数据的方式，任何一张表都有行和列：

行（row）：被称为数据/记录

列（column）：被称为字段，每个字段都有字段名、数据类型和约束等属性

4、SQL语句的分类

DQL（数据查询语言）：select

DML（数据操作语言）：insert、delete、update

操作的是表中数据

DDL（数据定义语言）：create、drop、alter(改)

操作的是表的结构

TCL（事务控制语言）

事务提交：commit

事务回滚：rollback

DCL（数据控制语言）

授权：grant

撤销权限：revoke

5、创建三张表

员工表

部门表

工资等级表

6、基础查询

查询表中数据

select * from emp;

select、from是关键字

emp是标识符

查询表结构

desc emp;;

desc-->describe

查看数据库版本号

select version;

查看所使用的的数据库

select database();

终止查询，即查询语句写一半之后不想写了

***注：MySQL是不见分号不执行，不区分大小写

7、查询多个字段

字段之间用分号隔开

select deptno,dname from dept;

查询所有字段

select * from dept；

***注：使用*进行查询效率较低，因为在查询的过程中会将*转换为字段，需要时间，且可读性查，实际开发中不建议写在程序里面

8、给查询的列起别名

使用as关键字给列取别名

select deptno,dname as deptname from dept;

select deptno,dname deptname from dept;

select deptno,dname as 'dept name' from dept;

***注：只是将查询结果里面的dname字段的列名显示为deptname，原表的列名还是dname，select语句永远都不会进行修改操作，别名里面有空格需要用单/双引号括起来；在所有的数据库中，字符统一使用单引号括起来，这是标准的，双引号在Oracle里面用不了，在MySQL里面可以使用；

9、查询员工的年薪

字段可以使用数学表达式

select ename,sal*12 as yearsal from emp;

select ename,sal*12 as '年薪' from emp;

***注：别名是中文需要用单引号括起来

10、条件查询

语法格式

select

字段1, 字段2

from

表名

where

条件;

条件：=，<> != 不等于，<, <=, >, >=, between.. and ..., is null, is not null, and ,or, in , not in,not, like(模糊查询，支持%和_匹配)

select empno,ename from emp where sal = 800;

select empno,ename from emp where sal <> 800; // 小于号和大于号组成的不等号

select empno,ename from emp where sal != 800;

select empno,ename from emp where sal between 800 and 2000; // between后面的数必须比and后面的数小，左闭右闭，即包括800和2000

---案例：查询津贴为null的员工/n

select empno,ename,sal,comm from emp where comm is null; // null不能用等号进行衡量，null不是一个值，代表什么都没有

---查询津贴不为null的员工

select empno,ename,sal,comm from emp where comm is not null;

---查询工作岗位为manager和salesman的员工

select empno,ename,job from emp where job = 'manager' or job = 'salesman';

---and和or同时出现的优先级问题：查询工资大于2500，并且部门编号为10或20的员工

select empno,ename,deptno from emp where sal > 2500 and (deptno = 10 or deptno = 20);

---%和_是两个特殊的字符，其中%表示任意多个字符，_表示任意一个字符

查询名字中含有o的员工

select ename from emp where ename like '%o%';

案例：查询第三个字母是R的员工/n

select ename from emp where ename like '__o%';

查询名字中有_的员工

select ename from emp where ename like '%\_%'; // \是转移字符

11、排序

案例：查询所有员工的薪资，排序/n

select ename, sal from emp order by sal; // 默认是升序

查询所有员工的薪资，指定降序排列

select ename, sal from emp order by sal desc;

查询所有员工的薪资，指定升序排列

select ename, sal from emp order by sal asc;

12、多字段排序

查询员工的名字和薪资，要求按照薪资升序，如果薪资一样再按照名字降序排列/n

select ename,sal from emp order by sal asc, ename asc;

前一个字段是主要的排序字段，只有sal相等的情况下，ename才会起作用

13、根据字段位置排序

案例：查询员工名字和薪资，按照表格第二列进行排序/n

select ename,sal from emp order by 2;

14、语句的执行顺序

select

...

from

...

where

...

order by

...；

以上语句的执行顺序：

第一步：from

第二步：where

第三步：select

第四步：order by

***理解：首先去找是哪张表（1），再拿着条件去筛选过滤（2、3），最后排序（4）

15、数据处理函数

数据处理函数被称为单行处理行数

单行处理函数特点是一个输入对应一个输出，数据是一行一行进行处理的，行与行之间在处理过程中是没有关系的

多行处理函数特点是多个输入对应一个输出

常见的单行处理函数

①lower 转换小写

select lower(ename) as ename from emp;

②upper 转换大写

select upper(ename) as ename from emp;

③substr 取子串

substr(被截取额字符串, 起始下标, 截取长度)

select substr(ename, 1, 1) as ename from emp;

注：起始下标从0开始。没有0

案例：查询员工名字中第一位字母是A的员工信息/n

select ename from emp where ename like 'A%';

select ename from emp where substr(ename, 1, 1) = 'A';

concat 字符串拼接

select concat(empno,ename) from emp;

案例：查询员工姓名，并将其首字母大写/n

select concat(upper(substr(ename,1,1))，substr(ename,2,length(ename) - 1))) as ename from emp;

④ length 取长度

select length(ename) as ename from emp;

⑤ trim 去空格

select * from emp where ename = trim(' KING ');

⑥ str_to_date 将字符串转换为日期

⑦ date_format 格式化日期

⑧ format 设置千分位

⑨ round 四舍五入

round(数字，保留小数位)

round(1236.567,-1) 保留到十位

round(1236.567,-2) 保留到百位

select round(1236.567,0) as result from emp;

生产100以内的随机数

random() 生成0到1之间的随机数

select round(random() * 100, 0) from emp;

⑩ ifnull

案例：查询员工的年薪/n

select ename, (sal + ifnull(comm, 0)) * 12 as yearsal from emp;

case...when...then...when...then...else...end

案例：当员工工作岗位是manager的时候，工资上调10%，当工作岗位是salesman的时候，工资上调50%，其他正常（只是显示结果为工资上调，不修改数据库）/n

select

ename,

job,

sal as oldsal,

(case job when job = 'manage' then sal * 1.1 when sal = 'salesman' then sal * 1.5 else sal end) as newsal

from

emp;

***注：null只要参与运算，最后的结果一定是null

***注：select后面可以跟某个表的字段名（可以等同为变量名），也可以跟字面量/字面值（数据）。

select 2100 as num from emp;

16、分组函数（多行处理函数）

多行处理函数的特点：输入多行，输出一行

分组函数有5个：count、sum、avg、max、min

案例：查询最高工资/n

select max(sal) from emp;

查询最低、平均工资和工资和

select min(sal) from emp;

select avg(sal) from emp;

select sum(sal) from emp;

案例：查询员工数量/n

select count(*) from emp;

分组函数不能够使用在where子句中，因为分组函数必须要在分组之后才能使用，而在关键字的执行顺序上，是先执行where，再执行group by，所以，where后面不能出现分组函数/n

***注意：分组函数在使用的时候必须先进行分组，才能使用；如果没有对数据进行分组，则默认整张表为一组；分组函数自动忽略null，不用加条件进行过滤；分组函数中count(具体字段)表示统计该字段下所有不为null的数据的总数，count(*)表示统计表中数据的行数，因为所有字段都为null就不应该存在这条数据记录，所以，如果有数据记录存在，则一定有字段不为null；

17、分组查询

在实际应用中，可能需要先进行分组，然后对每一组数据进行操作

select

...

from

...

where

...

group by

...

order by

...

以上关键字的执行顺序

1.from 2.where 3.group by 4.select 5.order by /n

理解：首先肯定是要确定要查询的表，其次是做过滤，之后是将过滤的数据分组，接着是把数据给查询出来，最后是排序输出 /n

案例：查询每个部门的平均薪资/n

select avg(sal) from emp group by deptno;

查询每个工作岗位的工资和

select job,sum(sal) from emp group by job;

查询每个部门的最高薪资

select deptno,max(sal) from emp group by deptno;

案例： 查询每个部门，不同工作岗位的的最高薪资(多字段分组) /n

技巧：将两个字段联合成一个字段看，和order by 相似

select deptno,job,max(sal) from emp group by deptno, job;

案例：查询每个部门的最高薪资，要求显示薪资大于3000的 /n (having 和 where都能使用)

select deptno,max(sal) from emp where sal > 3000 group by deptno;

也可以使用having，having必须和group by联合使用

select deptno,max(sal) from emp group by deptno having max(sal) > 3000;

案例：查询每个部门的平均薪资，要求显示平均薪资大于2500的 /n（只能使用having）

select deptno, avg(sal) from emp group by deptno having avg(sal) > 2500;

在having和where都能使用的情况下，尽量使用where，其效率更高：/n

where指定行所对应的条件。having指定组所对应的条件。通常情况下，将条件写在where字句中比写在having子句中执行速度更快。

通过where字句指定条件时，由于排序之前就对数据进行了过滤，所以能够减少排序的数据量。而having字句是在排序之后才对数据分组的，因此需要排序的数据量比where的要多。执行速度自然要慢。

另外，where字句的速度更快的一个原因是，可以对where字句指定条件所对应的列创建索引。这样也可以大幅提高处理速度。创建索引是一种非常普遍的提高数据库性能的方法。

重点结论：在一条select语句中，如果有group by 语句的话，select后面只能跟参加分组的字段，以及分组函数，其他一律不能跟，因为查询出的数据如果有其他字段，且没有参加分组，在MySQL中，会随机选择当前字段中的某一行数据填充进去，这个字段的数据是毫无意义的，在Oracle中则会报错/n

17、单表查询总结

select

...

from

...

where

...

group by

...

having

...

order by

...

执行顺序：1.from 2.where 3.group by 4.having 5.select 6.order by /n

理解：先确定要查询的表，接着将表中数据进行过滤，将过滤后的数据进行分组，将分组后的数据再过滤（where不能做的过滤），之后就将数据查询出来，最后是排序输出

案例：查询出每个岗位的平均薪资，要求显示平均薪资大于1500的，除manager岗位之外，要求按照平均薪资降序排列 /n

select job,avg(sal) from emp where job != 'manger' group by job having avg(sal) > 1500 order by avg(sal) desc;

18、distinct关键字

distinct 去除重复数据，只能出现在所有字段的最前端

select distinct job from emp;

select ename, distinct job from emp;(×)

select distinct job,deptno from emp;(√) // 两个字段联合去除重复记录

二、连接查询（多表查询）

1.连接查询的分类

根据表连接的方式分类：

内连接：

等值连接

非等值连接

自连接

外连接：

左外连接（左连接）

右外连接（右连接）

2、笛卡尔积现象

（1）当两张表进行连接查询时，没有任何条件的限制会发生什么现象？

最终查询结果条数是两张表条数的乘积，这种现象称为笛卡尔积现象

案例：查询每个员工所在部门的名称；

emp表

empno	ename	job	mgr	hiredate	sal	comm	deptno
员工编号	员工名称	岗位	上级领导编号	入职日期	工资	津贴	部门编号

dept表

deptno	dname	loc
部门编号	部门名称	部门位置

salgrade表

grade	losal	hisal
工资等级	工资下限	工资上限

select ename, dname from emp, dept;

（2）怎么避免笛卡尔积现象？

连接时加条件，将满足条件的记录筛选出来。

select ename, dname from emp, dept where emp.deptno = dept.deptno;

（3）添加条件后，最终查询的记录少了很多，但是匹配的过程中，匹配的次数减少了吗？

没有，还是全匹配，及两个表中记录条数的乘积

select e.ename, d.dname from emp e, dept d where e.deptno = d.deptno;

给表起别名可以提高查询效率，当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误. /n

3、内连接之等值连接

条件是一个等量关系，称为等值连接

案例：查询每个员工所在部门名称，显示员工名和部门名/n

SQL92

select

e.ename, d.dname

from

emp e, dept d

where

e.deptno = d.deptno;

或

SQL99

select

e.ename, d.dname

from

emp e

inner join

dept d

e.deptno = d.deptno; // 内连接的特点：①将完全能匹配条件的数据全部查询出来；②连接的两张表之间没有主次关系/n

SQL92的缺点：结构不清晰，表的连接条件和后期进一步筛选的条件都放到了where后面

SQL99的优点：表连接是独立的，连接之后，如果还需进一步筛选，再往后继续添加where条件

4、内连接之等值连接

条件不是一个等量关系，称为非等值连接

案例：查询出每个员工的薪资等级，要求显示员工名，薪资，薪资等级/n

select

e.ename,e.sal,s.grade

from

emp e

join

salgrade s

e.sal between s.losal and s.hisal;

5、内连接之自连接

两张表都是同一张表，将两个表进行连接查询

案例：查询员工的上级领导，要求显示员工名和对应的领导名/n

select

a.ename as '员工名', b.ename as '领导名'

from

emp a

join

emp b

a.mgr = b.empno;

6、外连接

左连接：将join关键字左边的表看成主表，查询语句主要是为了将主表的数据全部查询出来，捎带着关联右表查询

右连接：将join关键字右边的表看成主表，查询语句主要是为了将主表的数据全部查询出来，捎带着关联左表查询

思考：外连接的查询结果条数一定是大于等于内连接的查询结果条数？正确/n

案例：查询每个员工的上级领导，要求显示所有员工的名字名字和领导名/n

select

a.ename as '员工名', b.ename as '领导名'

from

emp a

left join

emp b

a.mgr = b.empno;

7、三张及以上的表连接

select

...

from

join

a和b的连接条件

join

a和c的连接条件

right join

a和d的连接条件

一条SQL中内外连接可以混合，都出现

案例：查询出每个员工的部门名称、工资等级和上级领导，要求显示员工名、部门名、薪资、薪资等级和上级领导/n

select

e.ename,d.dname,e.sal,s.grade, b.ename

from

emp e

join

dept d

e.deptno = d.deptno

join

salgrade s

e.sal bteween s.losal and s.hisal

left join

emp b

e.mgr = b.empno;

8、子查询

select语句中嵌套select语句，被嵌套的select语句成为子查询

子查询可以出现的位置：

select

...(select)

from

...(select)

where

...(select)

（1）where语句中的子查询：

案例：查询出比最低工资高的员工姓名和工资/n

第一步：查询最低工资

select sal from emp order by sal asc limit 1;

select min(sal) from emp;

select

e.ename, e.sal

from

emp e

where

e.sal > (select sal from emp order by sal limit 1);

（2）from子句中的子查询

from后面的子查询，可以将子查询的查询结果当做一张临时表/n

案例：找出每个岗位的平均工资的薪资等级/n

select

t.job,t.avgsal, s.grade

from

(select job,avg(sal) as avgsal from emp group by job) t

join

salgrade

t.avgsalbetween s.losal and s.hisal;

（3）select后面出现的子查询

9、union合并查询结果集

案例：查询工作岗位为manager和salsman的员工/n

select ename,job from emp where job in ('manager','salsman');

union写法：

select ename,job from emp where job = 'salsman'

union

select ename,job from emp where job = 'manager';

***注：以上两个写法中，union的效率要高一些。对于表连接来说，每连接一次新表，则匹配次数满足笛卡尔积现象，成倍的翻。但是union可以减少匹配的次数。在减少匹配次数的情况下，还可以完成两个结果集的拼接；/n

举例：a表连接b、c表，a、b和c的记录条数均为10，不使用union匹配次数为10的三次方，使用union：a连接b的匹配次数为100，a连接c的匹配次数为100，总的匹配次数为200---union将乘法变成了加法

10、limit 取部分结果集显示 (很重要)

limit的作用

将查询结果集的一部分取出来，通常使用在分页查询中，分页的作用是为了提高用户的体验，因为一次全部都查询出来，用户体验差，可以分页一页一页地浏览

limit的使用

缺省用法 limit length;

完整用法 limit startIndex, length;(起始下标默认从0开始)

案例：查询工资前5的员工

select ename,sal from emp order by sal desc limit 5;

案例：查询工资排名3到5的员工/n

select ename,sal from emp order by sal desc limit 2,3;

11、页面分页

每页显示3条数据

第一页：limit 0,3 [0,1,2]

第二页：limit 3,3 [3,4,5]

第三页：limit 6,3 [6,7,8]

所以公式为

limit (pageNo-1) * pageSize, pageSize

12、完整的SQL语句

select (5)

...

from (1)

...

where (2)

....

group by (3)

...

having (4)

...

order by (6)

...

limit (7)

...

13.create drop insert update delete

create table 表名 (字段，字段类型)

drop table if exists 表名

insert into 表名 (字段名) values(字段值)

一次插入多条记录：insert into 表名 (字段名) values(字段值)(字段值)(字段值)....

update 表名 set 字段名 = ' xxx ' ... where 条件

delete from 表名 where 条件;

命名规范：所有标识符都是全部小写，单词和单词之间是用下划线进行衔接

str_to_date('字符串日期','日期格式')

MySQL的日期格式：%Y（年）,%m（月）,%d（日）,%h（时）,%i（分）,%s（秒）

MySQL自动类型转换：如果字符串的格式为"2023-03-05 05:16:22"，MySQL会自动将字符串转换为datetime格式

14、删除数据原理/n

delete语句删除是将表中的数据删除了，但是数据在硬盘上的真实存储空间不会被释放，缺点是删除效率比较低，优点是可以回滚rollback，删除的数据可以通过回滚恢复；（DML语句）

truncate语句（truncate table 表名）删除表中数据是将表一次截断，物理删除，即将数据在硬盘上的真实存储空间给释放掉了，缺点是不可回滚，优点是删除效率高，速度快；（DDL语句）

三、约束和存储引擎

1.约束的作用

保证表中的数据有效

2.约束的分类

（1）非空约束：not null

非空约束的字段不能为空

建表语句：

create table t_worker(

id int;

name varchar(255),

email varchar(255) not null

)

（2）唯一性约束：unique

唯一性约束的字段不能重复，但是可以为null

create table t_worker(

id int;

name varchar(255),

email varchar(255) unique // 约束加在列后面，这种约束称为列级约束

);

案例：name和email联合起来具有唯一性/n

create table t_worker(

id int;

name varchar(255),

email varchar(255),

unique(name,email) // 约束没有加在列后面，这种约束称为表级约束

);

什么时候使用表级约束？/n

需要给多个字段联合起来添加一个约束的时候，需要使用表级约束;not null没有表级约束；

在MySQL中，如果一个字段同时被not null和unique约束的话，该字段会自动变成主键字段。/n

（3）主键约束：primary key (PK)(很重要)

什么是主键，它的作用是什么？

主键是每一行记录的唯一标识；任何一张表都应该有主键，没有主键，表无效；

主键特征

not null + unique

create table t_worker(

id int;

name varchar(255),

email varchar(255),

primary key(id) // 一个字段做主键叫单一主键

);

create table t_worker(

id int;

name varchar(255),

email varchar(255),

primary key(id,name) // 多个字段联合起来做主键叫复合主键

);

复合主键在实际开发中不建议使用，主键值存在的意义是唯一区分某行记录的标识，单一主键就可以做到，复合主键比较复杂，不建议使用；一张表，主键约束只能添加一个；主键值一般都是数字，是定长的，不建议使用varchar类型的字段做主键值；/n

为什么不建议使用varchar修饰的字段做主键？/n

主键通常应该是一些无意义的值，例如自动递增的数字或GUID(全局唯一标识符 Globally Unique Identifier).varchar相对于int来说占用磁盘空间多，磁盘io也会多，然后内存带宽也会多。这点上尤其在innodb更为明显，innodb表的Secondary index的 leaf page中都要保存primary key的值，主键如果是varchar，会导致secondary index的体积会比较大。而且varchar主键在比较上也会慢一些，插入时容易发送数据的非顺序插入，导致碎片，index tree效率比int低

（4）外键约束：foreign key (FK)（很重要）

t_class 班级表

classno（PK）	classname

t_student 学生表

no(PK)	name	classno(FK)

create table t_class(

classno int primary key;

classname varchar(255)

);

create table t_student(

no int primary key;

name varchar(255)，

classno varchar(255),

foreign key(classno) reference t_class(classno)

);

学生表里面的classno字段对应的是班级表中的classno字段，classno字段是班级表中的主键，其具有非空唯一性；学生表里面的classno字段和班级表中的classno字段相对应，即学生表里面的classno字段的字段值都是班级表中的classno字段的字段值中有的，换句话说，学生表中的classno字段的所有字段值去重放在一起形成一个集合，这个集合应该是班级表中的classno字段的所有字段值去重放在一起形成集合的子集，加上FK就可以实现这样的效果；

子表中的外键引入的父表中的某个字段，被引入的这个字段不一定需要是主键，但是需要具有唯一性，即需要被unique修饰；/n

外键约束的作用

每次插入的数据，有外键约束的字段值必须是附表相关字段的引用，不能取集合以外的值，否则数据插入的时候会报错；

以上的学生表和班级表形成了父子表的关系，班级表是父表，学生表是子表；

创建表的时候是先创建父表，再创建子表；

删除表时是先删除子表，再删除父表；

删除数据时是先删除子表中数据，再删除父表数据；

插入数据时是线插入父表数据，再插入子表数据；

插曲：XXX.sql文件被称为SQL脚本文件，里面编写了大量的SQL语句，当执行SQL脚本文件的时候，该文件中所有的SQL语句都会执行，批量的执行SQL语句，可以使用SQL脚本文件。MySQL中怎么执行SQL脚本：source 脚本的绝对路径 + 脚本名称.sql

varchar 和 char的区别：/n

在建表的时候，当该字段是字符串类型的数据时，我们用varchar 和 char作为建表时该字段的数据类型；char(255) 表示记录在插入表格中时，该字段会被固定分配255字节的空间给它使用；varchar（255）表示记录在插入表格中时，该字段会被动态分配存储空间，字符串有多长就分配多长的空间，但是最多255字节；char效率快，但是利用率不高，varchar需要动态分配资源，所以效率快，但是利用率高，在实际建表中，需要合理使用两种数据类型；

3.什么是存储引擎

存储引擎是一个表存储/组织数据的方式，不同的存储引擎，表存储数据的方式不同

MySQL默认的存储引擎ENGINE是：InnoDB

MySQL默认的字符编码方式CHARSET是：utf8

InnoDB是重量级的存储引擎，支持事务机制，支持数据库崩溃后自动恢复机制，其最主要的特点是安全

三、事务（很重要）

一个事务其实就是一个完整的业务逻辑

什么是一个完整的业务逻辑

假设转账，从A账户向B账户转钱10000，A账户的钱减去10000，B账户的钱加上10000，这就是一个完整的业务逻辑

以上的操作是一个最小的工作单元，要么同时成功，要么同时失败，不可再分

只有DML语句（增删改）才与事务有关

1.存在事务的原因

因为现实生活中的业务需要多条增删改语句共同联合起来才能完成，考虑数据的安全性，才有了事务机制，如果所有的业务只要一条DML语句就能完成，就没有必要存在事务机制了

2.事务的实质

一个事务其实就是多条DML语句同时成功或者同时失败

3.MySQL实现事务机制

InnoDB存储提供了一组用来记录事务性活动的日志文件，在事务的执行过程中，每一条DML操作都会被记录到事务性活动的日志文件中，与此同时，我们可以提交事务，也可以回滚事务

提交事务

清空事务性活动的日志文件，将数据全部彻底持久化到数据库表中

提交事务标志着事务的结束，并且是一种全部成功的结束

回滚事务

清空事务性活动的日志文件，将之前所有的DML操作全部撤销

回滚事务标志着事务的结束，并且是一种全部失败的结束

4.提交和回滚事务

开启事务：start transaction；

提交事务：commit;语句

回滚事务：rollback;语句

5.事务的特性 ACID

A 原子性：事务是最小的工作单元，不可再分

C 一致性：所有事务要求，在同一个事务中，所有操作必须同时成功或者同时失败，以保证数据的一致性

I 隔离性：A事务和B事务之间具有一定的隔离性

D 持久性：事务最终结束的一个保障。事务提交就相当于将没有保存到硬盘上的数据保存到硬盘上

6.事务的隔离级别/n

（1）读未提交 read uncommitted (隔离级别最低)

事务A可以读取到事务B未提交的数据

存在的问题：脏读

脏读：读取到没有提交的脏数据

（2）读已提交 read committed

事务A只能读取到事务B已提交的数据

解决问题：脏读

存在的问题：不可重复读取数据

不可重复读取数据：事务开始读取的数据是4条，事务还未结束，读取的数据变成5条，两次读取到的数据不一致，称为不可重复读

（3）可重复读 repeatable read

事务A开启之后，无论多久，每一次读到的数据都是一致的，即使事务B将数据修改并提交了，事务A读取的数据还是没有发生改变，这就是可重复读

解决问题：不可重复读

存在问题：幻读

幻读：每次读到的数据都不是真实的数据，只要事务不结束，读到的数据都是一模一样的

MySQL中默认的事务级别是可重复读

（4）序列化/串行化 serializable（隔离级别最高）

事务A开启后，事务B不能执行，必须事务A提交之后才能执行事务B;类似于synchronize，线程同步；

解决问题：幻读，每次读到的数据都是真实的

存在问题：效率最低，不允许并发

7.开启和结束事务

start transaction;

commit; or rollback;

四、索引

索引是在数据库表的字段上添加的，是为了提高查询效率存在的一种机制

一张表的一个字段可以添加一个索引，当然，多个字段联合起来也可以添加索引

索引相当于一本书的目录，是为了缩小扫描范围而存在的一种机制

1.查询数据的两种方式

第一种：全表扫描，where后的条件中的字段没有添加索引，就会做全表扫描，将该字段上的每一个值都进行一次匹配。从前往后，一条条数据地找，直到查找到满足要求的数据；

第二种：根据索引检索，where后的条件中的字段有添加索引，通过索引定位到位置，进行局部扫描，缩小扫描的范围，效率较高；

2.索引的排序

字典的目录是按a,b,c...排序的，只有排序了才会有区间查找一说，缩小扫描范围其实就是扫描某个区间

在MySQL数据库中，索引也是需要排序的，并且这个索引的排序和TreeSet数据结构相同。TreeSet的底层是一个自平衡二叉树。索引是一个B-Tree数据结构

3.索引的实现原理

在任何数据库中，主键会自动添加索引；在MySQL中，有unique约束的字段也会自动创建索引；

在任何数据库中，任何一张表中的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。/n

在MySQL中，索引是一个单独的对象，使用InnoDB数据引擎，索引存储在一个逻辑名称为tablespace的文件中。

4、添加索引的条件

条件1：数据量庞大（数据量庞大的界限需要进行测试）

条件2：该字段经常出现在where后面，以条件的形式出现，即该字段经常被扫描

条件3：该字段很少DML操作，因为DML操作之后。索引需要重新排序

建议：不要随意添加索引，因为索引也是需要进行维护的，太多的话反而会降低系统的性能，建议通过主键或是unique约束的字段进行查询，效率是比较高的；/n

5.索引的创建和删除

create index emp_index on emp(ename)

drop index emp_index on emp(ename)

怎么查看一个SQL语句是否使用索引进行检索？/n

explain select ename from emp where ename = 'KING';

使用explain会将查询的详细信息打印出来，其中的type类型就是用来判断是否使用索引查询，如果type=all，表示没有用索引进行查询，如果type=ref，表示使用了索引进行查询；

6、索引失效/n

索引失效的第一种情况

select * from emp where ename like '%T';

上面的查询语句中，ename上即使添加了索引，也不会走索引，因为模糊匹配中以‘%’开头了，尽量避免模糊查询的时候以'%'开始，这是一种优化的手段；

索引失效的第二种情况

使用or的时候会失效，如果使用or，那么要求or两边的条件字段都要有索引，才会走索引，如果其中一边有一个字段没有索引，那么另一个字段上的索引也会失效，所以这也是为什么不建议使用or的原因，这是一种优化的手段；

索引失效的第三种情况

使用复合索引的时候没有使用左侧的列查找，索引失败

复合索引是指两个字段或者更多的字段联合起来添加一个索引

create index emp_job_sal_index on emp(job,sal)

select * from emp where job = 'manager'; // 有使用索引

select * from emp where sal= 800; // 有使用索引

索引失效的第四种情况

在where当中索引参加了运算，索引失效

select * from emp where sal + 1= 800; // 没有使用索引

索引失效的第五种情况

在where当中索引使用了函数，索引失效

select * from emp where lower(ename) = 'smith'; // 没有使用索引

7、索引的分类

单一索引：一个字段上添加索引

复合索引：两个字段或者更多的字段联合起来添加一个索引

主键索引：主键上添加索引

唯一性索引：具有unique约束的字段上添加索引

唯一性比较弱的字段上添加索引用处不大

五、视图

1、什么是视图

view，站在不同的角度看待同一份数据

2、视图的创建和删除

create view emp_view as select * from emp;

drop view emp_view;

注意：只有DQL语句才能以view的形式创建

create view emp_view as + DQL语句;

3、视图的作用

可以面向视图对象进行增删改查，对视图对象的增删改查会导致原表被操作；

视图就是将原表换个形式展示，也许我只需要展示几个字段，就可以操作视图来操作表；

视图可以简化SQL语句，比如一个SQL语句很长，但是我又需要在不同位置上多次使用，这个时候就可以创建一个视图代替这个SQL语句，用视图代替SQL语句，可以简化开发，有利于后期的维护，因为后期需要修改只需要修改一个地方就行，就相当于写程序的时候，每次都要一个方法，不可能每个函数里都要写这个函数吧，这个时候就可以把它抽出来，写到工具类里面；

视图对象就是表，视图不是存储在内存中，而是存储在硬盘上，不会消失。

六、数据库设计三范式

数据库设计的依据，教我们如何进行数据库表的设计；

第一范式

要求任何一张表都要有主键，每一个字段原子性不可再分

第二范式

要求所有非主键字段完全依赖主键，不要产生部分依赖

学生编号	学生姓名	教师编号	教师姓名

学生编号和教师编号联合做主键，可以满足第一范式，但是，学生姓名依赖学生编号，教师姓名依赖教师编号，产生了部分依赖，数据冗余；为了让以上表满足第二范式，需要设计三张表来表示多对多的关系

学生表

学生编号（PK）

学生姓名

教师表

老师编号(PK)

老师姓名

学生老师关系表

id（PK）

学生编号(FK)

老师编号(FK)

建立在第一范式的基础上

背口诀：多对多，三张表，关系表，两外键/n

第三范式

要求所有非主键字段直接依赖主键，不要产生传递依赖

学生编号（PK）

学生姓名

班级编号

班级名称

以上表的设计是描述：班级和学生的关系，很显然是一对多关系，一个班级有多个学生；

以上表有主键，满足第一范式；因为主键是单一主键，不是复合主键，没有产生部分依赖，满足第二范式；

由于班级名称依赖班级编号，班级编号依赖学生编号，产生了传递依赖，所以不满足第三范式，产生了数据冗余

班级表

班级编号（PK）

班级名称

学生表

学生编号（PK）

学生名称

班级编号（FK）

背口诀：一对多，两张表，多的表加外键/n

建立在第二范式的基础上

设计数据库表的时候，按照以上的范式进行，可以避免表中数据的冗余，空间的浪费

数据库三范式是理论上的，实践和理论是有偏差的，最终的目的都是为了满足客户的需求，有的时候是可以拿冗余换执行速度的，表连接次数越多，查询效率越低，且减少表的连接次数，SQL语句的编写难度也会降低。

MySQL优化建议

1、创建表的时候：应尽量建立主键；大数据表删除，用truncate table代替delete。
        2、合理使用索引：在应用中一张表的索引不要太多。对于数据操作频繁的表，索引需要定期重建，以减少失效的索引和碎片。
        3、查询尽量用确定的列名，少用*号。select * from tab;
        4、尽量少嵌套子查询，这种查询会消耗大量的CPU资源；
        5、对于有比较多or运算的查询，建议分成多个查询，用union all联结起来；
        6、多表查询的查询语句中，选择最有效率的表名顺序。数据库解析器对表解析从右到左，所以记录少的表放在右边。

yjh_________

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
MySql学习笔记

数据库（DataBase）是按照一定格式存储数据的一些文件的组合。数据存储的仓库，实际上就是一堆文件，这些文件中存储了具有特定格式的数据。数据库管理系统（DataBaseManagement）是专门用来管理数据库中文件的，数据库管理系统可以对数据库中数据进行增删改查。常见的数据库管理系统：MySQL、Oracle等SQL（Structured Query Language）是结构化查询语言，程序员通过编写SQL语句，然后DBMS负责执行SQL语句，最终来完成数据库中数据的CRUD。
复制链接

扫一扫