MySQL老杜课程学习笔记(入门级)(四)
1、存储引擎(了解内容)
1.1、什么是存储引擎
***存储引擎这个名字只有在mysql中存在,就是“表的存储方式”。***mysql支持很多存储引擎,每一个存储引擎都对应了一种不同的存储方式。每一个存储引擎都有自己的优缺点,需要在合适的时机选择合适的存储引擎。
1.2、完整的建表语句
CREATE TABLE t_x (
id int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
建表的时候可以指定存储引擎,也可以指定字符集。mysql默认使用的存储引擎是InnoDB方式。默认采用的字符集是UTF8
1.3、常见的存储引擎
①MyISAM引擎
MyISAM是mysql最常用的存储引擎,但是这种引擎不是默认的。
- MyISAM采用三个文件组织一张表:
- xxx.frm(存储格式的文件)
- xxx.MYD(存储表中数据的文件)
- xxx.MYI(存储表中索引的文件)
优点:可被压缩,节省存储空间。并且可以转换为只读表,提高检索效率。
缺点:不支持事务。
-----------------------------------------------------------------------------
②InnoDB引擎
-
表的结构存储在xxx.frm文件中
-
数据存储在tablespace这样的表空间中(逻辑概念),无法被压缩,无法转换成只读。
-
InnoDB存储引擎在MySQL数据库崩溃之后提供自动恢复机制。
-
InnoDB支持级联删除和级联更新。
优点:支持事务、行级锁、外键等。这种存储引擎数据的安全得到保障。
-------------------------------------------------------------------------------------
③MEMORY引擎
优点:查询速度最快。
缺点:不支持事务。数据容易丢失。因为所有数据和索引都是存储在内存当中的。
2、事务(Transaction)
2.1、什么是事务
一个事务是一个完整的业务逻辑单元,不可再分。
比如:银行账户转账,从A账户向B账户转账10000.需要执行两条update语句:
update t_act set balance = balance - 10000 where actno = 'act-001';
update t_act set balance = balance + 10000 where actno = 'act-002';
以上两条DML语句必须同时成功,或者同时失败,不允许出现一条成功,一条失败。
要想保证以上的两条DML语句同时成功或者同时失败,那么就需要使用数据库的“事务机制”。
只有DML语句和事务相关(insert delete update)
2.2、事务的特性
事务包括四大特性:ACID
-
A: 原子性:事务是最小的工作单元,不可再分。
-
C: 一致性:事务必须保证多条DML语句同时成功或者同时失败。
-
I:隔离性:事务A与事务B之间具有隔离。
-
D:持久性:持久性说的是最终数据必须持久化到硬盘文件中,事务才算成功的结束。
2.3、事务隔离性
此处讨论的隔离性,是不同的事务针对同一张表
事务隔离性存在隔离级别,理论上隔离级别包括4个:
- 第一级别:读未提交(read uncommitted)对方事务还没有提交,我们当前事务可以读取到对方未提交的数据。(A事务还没有提交修改,但是B事务已经能读到修改)
读未提交存在脏读(Dirty Read)现象:表示读到了脏的数据。
- 第二级别:读已提交(read committed)对方事务提交之后的数据我方可以读取到。 解决了脏读现象。
读已提交存在的问题是:不可重复读。
- 第三级别:可重复读(repeatable read)
可重复读存在的问题是:读取到的数据是幻象。
-
第四级别:序列化读/串行化读(serializable)
***问题:效率太低,需要事务排队。***
oracle数据库默认的隔离级别是:读已提交。
mysql数据库默认的隔离级别是:可重复读。
注意:mysql事务默认情况下是自动提交的。(只要执行任意一条DML语句则提交一次。)start transaction;可以关闭自动提交,若想提交事务,可以主动利用commit语句。
3、索引
3.1、索引简介
索引就相当于一本书的目录,通过目录可以快速的找到对应的资源。在数据库方面,查询一张表的时候有两种检索方式:
第一种方式:全表扫描
第二种方式:根据索引检索(效率很高)
索引原理是缩小了扫描的范围,从而提高搜索效率。
索引虽然可以提高检索效率,但是不能随意的添加索引,因为索引也是数据库当中的对象,也需要数据库不断的维护。是有维护成本的。比如,表中的数据经常被修改这样就不适合添加索引,因为数据一旦修改,索引需要重新排序,进行维护。
添加索引是给某一个字段,或者说某些字段添加索引。
索引的分类:
-
单一索引:给单个字段添加索引
-
复合索引: 给多个字段联合起来添加1个索引
-
主键索引:主键上会自动添加索引
-
唯一索引:有unique约束的字段上会自动添加索引
…
3.2、创建/删除 索引对象
创建索引对象:
create index 索引名称 on 表名(字段名);
删除索引对象:
drop index 索引名称 on 表名;
什么时候考虑给字段添加索引?
-
数据量庞大。(根据客户的需求,根据线上的环境)
-
该字段很少的DML操作。(因为字段进行修改操作,索引也需要维护)
-
该字段经常出现在where子句中。(经常根据哪个字段查询)
主键和具有unique约束的字段自动会添加索引。根据主键查询效率较高,尽量根据主键检索。
可以利用explain语句查看sql执行计划,可以看出是全搜索,还是利用索引的方式检索:
mysql> explain select ename,sal from emp where sal = 5000;
3.3、索引原理
索引底层采用的数据结构是:B + Tree(其实更复杂)
通过B + Tree缩小扫描范围,底层索引进行了排序,分区,索引会携带数据在表中的“物理地址”,最终通过索引检索到数据之后,获取到关联的物理地址,通过物理地址定位表中的数据,效率是最高的。
select ename from emp where ename = 'SMITH';
通过索引转换为:
select ename from emp where 物理地址 = 0x3;
注意:索引不是万能的,是会失效的,模糊查询的时候,第一个通配符使用的是%,这个时候索引是失效的。
select ename from emp where ename like '%A%';
4、视图(view)
**利用表的视图,可以像表名一样去修改数据,类似C++中的引用。**但通过视图是影响原表数据的,不是直接操作的原表,可以隐藏表的实现细节。保密级别较高的系统,数据库只对外提供相关的视图,程序员只对视图对象进行CRUD操作。
**创建/删除识图:**create view/drop view关键字
create view myview as select empno,ename from emp;
drop view myview;
注意:只有DQL语句才能以视图对象的方式创建出来。
create table emp_bak as select * from emp;
create view myview1 as select empno,ename,sal from emp_bak;
update myview1 set ename='hehe',sal=1 where empno = 7369; // 通过视图修改原表数据。
delete from myview1 where empno = 7369; // 通过视图删除原表数据。
5、DBA命令(导入导出)
由于DBA命令员对于非专业从事数据库管理的程序员来说,不需要深入了解指令,只需要直到基本的导入导出用法。
5.1、将数据库当中的数据导出
在windows的dos命令窗口中执行:(导出整个库)
mysqldump bjpowernode>D:\bjpowernode.sql -uroot -p密码
在windows的dos命令窗口中执行:(导出指定数据库当中的指定表)
mysqldump bjpowernode emp>D:\bjpowernode.sql -uroot –p密码
5.2、导入数据
create database bjpowernode;
use bjpowernode;
source D:\bjpowernode.sql
6、数据库设计三范式(重点内容,面试经常问)
范式是设计表的依据。按照范式设计的表不会出现数据冗余。
6.2、三种范式
-
第一范式:任何一张表都应该有主键,并且每一个字段原子性不可再分。
-
第二范式:建立在第一范式的基础之上,所有非主键字段完全依赖主键,不能产生部分依赖。
-
第三范式:建立在第二范式的基础之上,所有非主键字段直接依赖主键,不能产生传递依赖。
提醒:在实际的开发中,以满足客户的需求为主,有的时候会拿冗余换执行速度。
**一对一:**由于有些表字段太多,数据量太庞大,需要把一对一的表拆分,所以就要探讨如何设计高效的一对一的表。
- 主键共享(用的很少)
- 外键唯一
一对多 两张表,多的表加外键
多对多 三张表,关系表两外键