MySQL数据库学习
(本文为博主的学习记录,若有不正确的地方望指正。。。)
综述
数据库
- DataBase,简称DB。按照一定格式存储数据的一些文件的组合。
实际上是一堆文件,而这些文件中存储了具有特定格式的数据。
数据管理系统
- DataBaseManagement,简称DBMS。数据库管理系统是专门用来管理数据库中数据的,数据库管理系统可以对数据库当中的数据进行增删改查。
- 常见的数据库管理系统:
MySQL、Oracle、MS SqlServer、DB2、sybase等…
SQL(结构化查询语言)
- 编写SQL语句,DBMS执行SQL语句,最终来完成数据库中数据的增删改查操作。
- SQL是一套标准,SQL可以在mysql中可以使用,在Oracle和DB2中也可以使用。
- 三者的关系:DBMS – 执行 --> SQL – 操作 --> DB
RDBMS术语:
( Relational Database Management System) 关系型数据库管理系统。
- 数据库:是一些关联表的集合
- 数据表:表是数据的矩阵。在一个数据库中的表看起来就像一个简单的电子表格
- 列:一列(数据元素)包含了相同的数据,例如邮政编码的数据
- 行:—行(=元组,或记录),是一组相关的数据,例如用户的身份信息(name,age,salary。。。)
- 主键:主键是唯一的。一个数据表中只能包含一个主键,可以使用主键来查询数据。
- 外键:外键用于关联两张表。
- 复合键:(组合键)将多个列作为一个索引键,一般用于复合索引。
- 索引:使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构。类似与书籍的目录。
- 参照完整性: 参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。
端口号
- 端口号port是任何一个软件/应用都会有的,端口号是应用的唯一代表。
- 端口号通常和IP地址在一块,IP地址用来定位计算机的,端口号port是用来定位计算机上某个服务的/某个应用的!
- 注:在同一台计算机上,端口号不能重复,具有唯一性。
- mysql数据库启动后,这个服务占有的默认端口号是3306。
启动和关闭mysql服务
- 语法:
net stop 服务名称; net start 服务名称;
- 其它服务的启停都可以采用以上的命令。
MySQL数据库的常用命令
- 查看当前mysql中有哪些数据库
show databases;
- 注意:以分号结尾,分号是英文的分号。
- mysql默认自带了4个数据库。
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| mysql |
| performance_schema |
| sys |
+--------------------+
- 创建数据库
create database x;
x为创建的数据库的名称(这里创建cov,可以看到比之前多了一行内容)
mysql> create database cov;
Query OK, 1 row affected (0.22 sec)
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| cov |
| information_schema |
| mysql |
| performance_schema |
| sys |
+--------------------+
- 退出MySQL
exit
- 选择使用某个数据库,表示正在使用一个名字叫做x的数据库。
mysql> use x;
Database changed
- 查看某个数据库所拥有的表
mysql> show tables;
- 查看mysql数据库的版本号:
mysql> select version();
- 查看当前使用的是哪个数据库?
mysql> select database();
+-------------+
| database() |
+-------------+
| bjpowernode |
+-------------+
- 注意:
- mysql是不见 “;” 不执行,“;”表示结束!
- \c 用来终止一条命令的输入。
- 导入sql文件中的数据
- 注 :路径中不要出现中文,x为文件名。
source <绝对路径>\x.sql
- 注 :路径中不要出现中文,x为文件名。
- 完整导入过程
mysql> use cov;
Database changed
mysql> source E:\mysqlTables\bjpowernode.sql
mysql> show tables;
+-----------------------+
| Tables_in_cov |
+-----------------------+
| dept | # 处于这个方框中的的内容为表名。
| emp |
| salgrade |
+-----------------------+
- 查看表中数据:
select * from 表名;
- 查看表的结构:
desc 表名;
,describe缩写为desc。
数据库中的术语
- 数据库当中最基本的单元是表:table
- 数据库当中是以表格的形式表示数据的,因为表比较直观。
- 任何一张表都有行和列:
行(row):被称为数据/记录。
列(column):被称为字段。 - 每一个字段都有:字段名、数据类型、约束等属性。
数据类型:字符串,数字,日期等,后期讲。
约束:约束也有很多种,其中一个叫做唯一性约束,这种约束添加之后,该字段中的数据不能重复。
MySQL 概述
SQL语句的分类。
DQL:Data Query Language
数据查询语言(凡是带有select关键字的都是查询语句)
select...
DML:Data Mainpnlation Language
数据操作语言(凡是对表中的数据进行增删改的都是DML)
insert 增
delete 删
update 改
操作表中的数据data。
DDL:Data Definition Language
数据定义语言(凡是带有create、drop、alter的都是DDL。)
DDL主要操作的是表的结构。不是表中的数据。
create:新建,等同于增
drop:删除
alter:修改
这个增删改和DML不同,这个操作的是表结构。
TCL:Transactional Control Language
事务控制语言
事务提交:commit;
事务回滚:rollback;
DCL:Data Control Language
数据控制语言。
授权grant
撤销权限revoke
....
简单查询
mysql> show tables;
- 完整的表中数据
mysql> select * from 表名;
查询一个字段
select 字段名 from 表名;
- 表的结构
mysql> desc 表名;
- 注意:
1. select 和 from都是 关键字 ,字段名和表名都是标识符。
2. SQL语句是通用的,SQL语句不区分大小写。
3. 所有的SQL语句以“ ;” 结尾。
mysql> SELECT DNAME FROM DEPT;
查询两个字段,或者多个字段
使用逗号隔开“,”
mysql> select 字段名1,字段名2 from 表名;
查询所有字段
- 写出每个字段
select 字段名1,字段名2,字段名3,... from 表名;
- 使用
*
,这种方式的缺点:1、效率低,2、可读性差。在实际开发中不建议使用。
select * from 表名;
给查询的列起别名
select 字段名1,字段名2 as 别名 from 表名;
# 例
mysql> select deptno,dname as deptname from dept;
- 使用as关键字起别名。
注意:
1. 只是将显示的查询结果列名显示为deptname,原表列名还是叫:dname
2. select语句是永远都不会进行修改操作的。(只负责查询)
3. 可以省略as
mysql> select deptno,dname deptname from dept;
- 别名里面有空格
错误演示
mysql> select deptno,dname dept name from dept;
DBMS看到这样的语句,进行SQL语句的编译,不符合语法,编译报错。
- MySQL支持双引号的写法,但在Oracle里不支持。一般统一使用单引号。
- 注意:在所有的数据库当中,字符串统一使用单引号括起来,单引号是标准。
mysql> select deptno,dname 'dept name' from dept; # 加单引号
mysql> select deptno,dname "dept name" from dept; # 加双引号
- 字段可以使用数学表达式,可以进行加减乘除的操作。
mysql> select ename,sal*12 from emp;//乘法运算。
mysql> select ename,sal*12 as '年薪' from emp; //别名若是是中文,用单引号括起来。
条件查询
- 查询符合条件的
语法格式:
select
字段1,字段2,字段3....
from
表名
where
条件;
条件
运算符 | 作用 |
---|---|
= | 等于 |
<>或 != | 不等于 |
< | 小于 |
<= | 小于等于 |
> | 大于 |
>= | 大于等于 |
-
字符串使用单引号
-
小于号和大于号组成的不等号(一般使用!=)
= and <= 和between … and …. 两个值之间, 等同于 >= and <=。
# 使用between...and...的时候,必须遵循左小右大,between...and...是闭区间,包括两端的值。
is null 与 null
is not null # 不为空
# 在数据库当中null不能使用等号进行衡量。需要使用is null因为数据库中的null代表什么也没有,它不是一个值,所以不能使用等号衡量。
and 并且 in 包含 or 或者
# 注意:and和or同时出现,and优先级高于or,如果想让or先执行,需要加“小括号”
# in相当于多个 or (not in 不在这个范围中)
# in不是一个区间。in后面跟的是具体的值。
not 可以取非,主要用在 is 或 in 中
is null
is not null
in
not in
模糊查询
- like :称为模糊查询,支持%或下划线匹配
%匹配任意多个字符
下划线:任意一个字符。
(%是一个特殊的符号,_ 也是一个特殊符号)
找出名字中含有O的
select ename from emp where ename like '%O%';
找出名字以T结尾的
select ename from emp where ename like '%T';
找出名字以K开始的
select ename from emp where ename like 'K%';
找出第二个字每是A的
select ename from emp where ename like '_A%';
找出第三个字母是R的
select ename from emp where ename like '__R%';
找出名字中有“_”的
mysql> select name from t_student where name like '%\_%'; # \转义字符。
排序
升序
select
ename,sal
from
emp
order by
sal; # 默认是升序
(sal asc;) # 指定升序
降序
select
ename,sal
from
emp
order by
sal desc;
多个字段排序
# 查询员工名字和薪资,要求按照薪资升序,如果薪资一样的话,
# 再按照名字升序排列。
select
ename,sal
from
emp
order by
sal asc, ename asc; # sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序。
- 了解:根据字段的位置也可以排序
select ename,sal from emp order by 2;
2表示第二列。第二列是sal
按照查询结果的第2列sal排序。
了解一下,不建议在开发中这样写,因为不健壮。
因为列的顺序很容易发生改变,列顺序修改之后,2就废了。
案例:
找出工资在1250到3000之间的员工信息,要求按照薪资降序排列。
select
ename,sal
from
emp
where
sal between 1250 and 3000
order by
sal desc;
关键字顺序不能变:
select
...
from
...
where
...
order by
...
以上语句的执行顺序必须掌握:
第一步:from
第二步:where
第三步:select
第四步:order by(排序总是在最后执行!)
数据处理函数
-
数据处理函数又被称为单行处理函数
-
单行处理函数的特点:一个输入对应一个输出。
-
和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!)
-
常见的单行处理函数
函数 | 作用 | 演示 | 注意 |
---|---|---|---|
lower | 转换小写 | select lower(字段名) from 表名; | |
upper | 转换大写 | select upper(字段名) from 表名; | |
substr | 取子串(substr( 被截取的字符串, 起始下标,截取的长度)) | select substr(字段名, 起始, 截取长度) as ename from 表名; | 起始下标从1开始,没有0。 |
concat | 函数进行字符串的拼接 | select concat(字段名,字段名) from 表名; | |
length | 取长度 | select length(字段名) (别名) from 表名 | |
trim | 去空格 | select * from emp where ename = trim(’ KING’); |
函数 | 作用 |
---|---|
str_to_date | 将字符串转换成日期 |
date_format | 格式化日期 |
format | 设置千分位 |
round | 四舍五入 |
rand() | 生成随机数 |
ifnull | 可以将 null 转换成一个具体值 |
- 单行处理函数的特点:输入多少输出多少。
# 案例:找出员工名字第一个字母是A的员工信息?
# 第一种方式:模糊查询
select ename from emp where ename like 'A%';
# 第二种方式:substr函数
select
ename
from
emp
where
substr(ename,1,1) = 'A';
# 首字母大写
select name from t_student;
select upper(substr(name,1,1)) from t_student;
select substr(name,2,length(name) - 1) from t_student;
select concat(upper(substr(name,1,1)),substr(name,2,length(name) - 1)) as result
from
t_student;
+----------+
| result |
+----------+
| Zhangsan |
| Lisi |
| Wangwu |
| Jack_son |
+----------+
- 案例:当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其它正常。
case..when..then..when..then..else..end
当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其它正常。
(注意:不修改数据库,只是将查询结果显示为工资上调)
select
ename,job, sal as oldsal,
(case job when 'MANAGER' then sal*1.1 when 'SALESMAN' then sal*1.5 else sal end) as newsal
from
emp;
select 字段 from 表名;
select ename from emp;
select 'abc' from emp; # select后面直接跟“字面量/字面值”
mysql> select 'abc' as bieming from emp;
# 这样肯定报错,因为会把abc当做一个字段的名字,去emp表中找abc字段去了。
select 1000 as num from emp; # 1000 也是被当做一个字面量/字面值。
# 结论:select后面可以跟某个表的字段名(可以等同看做变量名),也可以跟字面量/字面值(数据)。
select 21000 as num from dept;
mysql> select round(1236.567, 0) as result from emp;
# 保留整数位。
select round(1236.567, 1) as result from emp;
# 保留1个小数
select round(1236.567, 2) as result from emp;
# 保留2个小数
select round(1236.567, -1) as result from emp;
# 保留到十位。
select round(1236.567, -2) as result from emp;
# rand() 生成随机数
select round(rand()*100,0) from emp;
# 100以内的随机数
ifnull 可以将 null 转换成一个具体值
ifnull是空处理函数。专门处理空的。
在所有数据库当中,只要有NULL参与的数学运算,最终结果就是NULL。
select ename, sal + comm as salcomm from emp;
计算每个员工的年薪
年薪 = (月薪 + 月补助) * 12
select ename, (sal + comm) * 12 as yearsal from emp;
注意:NULL只要参与运算,最终结果一定是NULL。为了避免这个现象,需要使用ifnull函数。
# ifnull函数用法:ifnull(数据, 被当做哪个值)
如果“数据”为NULL的时候,把这个数据结构当做哪个值。
补助为NULL的时候,将补助当做0
select ename, (sal + ifnull(comm, 0)) * 12 as yearsal from emp;
分组函数(多行处理函数)
函数 | 用途 | 展示 |
---|---|---|
count | 计数 | select count(字段名) from 表名; |
sum | 求和 | select sum(字段名) from 表名; |
avg | 平均值 | select avg(字段名) from 表名; |
max | 最大值 | select max(字段名) from 表名; |
min | 最小值 | select min(字段名) from 表名; |
- 多行处理函数的特点:输入多行,最终输出一行。
- 注意:
- 分组函数在使用的时候必须先进行分组,然后才能用。
- 若未对数据进行分组,则整张表默认为一组。
分组函数在使用的时候需要注意的问题:
- 第一点:分组函数自动忽略NULL,不需要提前对NULL进行处理。
- 第二点:分组函数中
count(*)
和count(具体字段)
有什么区别?- count(具体字段):表示统计该字段下所有不为NULL的元素的总数。
- count(*):统计表当中的总行数。(因为每一行记录不可能都为NULL,一行数据中有一列不为NULL,则这行数据就是有效的。)
- 第三点:分组函数不能够直接使用在where子句中。
- 第四点:所有的分组函数可以组合起来一起用。
select sum(),min(),max(),avg(),count(*) from 表名;
分组查询(非常重要:五颗星*****)
- 在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作。
- 这个时候我们需要使用分组查询,怎么进行分组查询呢?
select
...
from
...
where
...
group by
...
order by
...
执行顺序
1. from
2. where
3. group by
4. select
5. order by
分组函数不能直接使用在where后面
例:
select ename,sal from emp where sal > min(sal);# 报错。(1)
select sum(sal) from emp; # (2)
-
注意:
- 分组函数在使用的时候必须先分组之后才能使用。
- where执行的时候,还没有分组。所以where后面不能出现分组函数。
-
(2)没有分组,但
sum()
函数可以使用,是因为select
在group by
之后执行。 -
在一条select语句当中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数,其它的一律不能跟。
-
技巧:两个字段联合成1个字段看。(两个字段联合分组)
-
使用having可以对分完组之后的数据进一步过滤。having不能单独使用,having不能代替where,having必须和group by联合使用。
优化策略:
where和having,优先选择where,where实在完成不了了,再选择
having。
select
...
from
...
where
...
group by
...
having
...
order by
...
以上关键字只能按照这个顺序来,不能颠倒。
执行顺序:
1. from
2. where
3. group by
4. having
5. select
6. order by
从某张表中查询数据,
先经过where条件筛选出有价值的数据。
对这些有价值的数据进行分组。
分组之后可以使用having继续筛选。
select查询出来。
最后排序输出!
连接查询
-
从一张表中单独查询,称为单表查询,表1和表2联合起来查询数据,从两表中各自获取数据。这种跨表查询,多张表联合起来查询数据的方式,被称为连接查询
-
把查询结果去除重复记录。注意:原表数据不会被修改,只是查询结果去重。去重需要使用一个关键字:distinct
select distinct 字段名1,字段名2 from 表名
# distinct出现在两个字段之前,表示两个字段联合起来去重。
# distinct只能出现在所有字段的最前方。
例:统计一下工作岗位的数量
select count(distinct job) from emp;
分类
根据语法的年代分类:
-
SQL92:1992年的时候出现的语法
# 表起别名。很重要。效率问题。 select e.ename,d.dname from emp e, dept d where e.deptno = d.deptno; # SQL92语法。
-
SQL99:1999年的时候出现的语法
SQL99语法: select ... from a join b on a和b的连接条件 where 筛选条件
- sql92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
- sql99的优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后继续添加where
根据表连接的方式分类:
-
内连接:
等值连接
非等值连接
自连接 -
外连接:
左外连接(左连接)
右外连接(右连接) 全连接
避免笛卡尔积现象
- 当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)
# 表起别名。很重要。效率问题。
select
e.ename,d.dname
from
emp e, dept d
where
e.deptno = d.deptno; # SQL92语法。
-
注意:
1、最终查询的匹配次数(两张表条数的乘积)未减少,只是在展示的时候通过筛选过滤了一部分的数据。
2、通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的连接次数。
内连接之等值连接。
SQL99语法:
select
e.ename,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
DBA(DataBaseAdministrator)数据库管理员
# inner可以省略(带着inner可读性更好!!!一眼就能看出来是内连接)
select
e.ename,d.dname
from
emp e
inner join
dept d
on
e.deptno = d.deptno; # 条件是等量关系,所以被称为等值连接。
内连接之非等值连接
select
e.ename, e.sal, s.grade
from
emp e
inner join
salgrade s
on
e.sal between s.losal and s.hisal; # 条件不是一个等量关系,称为非等值连接。
内连接之自连接
- 技巧:把一张表看成两张表。
select
a.ename as '员工名', b.ename as '领导名'
from
emp a
join
emp b
on
a.mgr = b.empno; # 员工的领导编号 = 领导的员工编号
# 内连接:(A和B连接,AB两张表没有主次关系。平等的。)
select
e.ename,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno; # 内连接的特点:把能够匹配上这个条件的数据查询出来。
左外连接
# outer是可以省略的,带着可读性强。
select
e.ename,d.dname
from
dept d
left outer join
emp e
on
e.deptno = d.deptno;
- 任何一个右连接都有左连接的写法。
- 任何一个左连接都有右连接的写法。
右外连接
# outer是可以省略的,带着可读性强。
select
e.ename,d.dname
from
emp e
right outer join
dept d
on
e.deptno = d.deptno;
-
right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。
-
在外连接当中,两张表连接,产生了主次关系。
-
外连接的查询结果条数一定是 >= 内连接的查询结果条数
-
例:多张表的连接
select ... from a join b on a和b的连接条件 join c on a和c的连接条件 right join d on a和d的连接条件
- 案例:找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级以及入职日期。
select e.ename as '员工',t.ename as '领导',d.dname as '部门名',e.sal as '薪资',s.grade as '薪资等级',e.hiredate as '入职日期' from emp e left join emp t on e.mgr = t.empno join dept d on d.deptno = e.deptno join salgrade s on e.sal between s.losal and s.hisal;
-
一条SQL中内连接和外连接可以混合。都可以出现!
子查询
- select语句中嵌套select语句,被嵌套的select语句称为子查询。
select
..(select).
from
..(select).
where
..(select).
-
where子句中的子查询
案例:找出比最低工资高的员工姓名和工资?
select ename,sal from emp where sal > (select min(sal) from emp);
-
from子句中的子查询
注意:from后面的子查询,可以将子查询的查询结果当做一张临时表。(技巧)
案例:找出每个岗位的平均工资的薪资等级。
select job,avg(sal) as avgsal from emp group by job
- 将以上查询作为一张表,放到 from 语句的后面
select job,avg(sal) from emp group by job; select t.*,s.grade from (select job,avg(sal) as avgsal from emp group by job) t join salgrade s on t.avgsal between s.losal and s.hisal;
-
select后面出现的子查询
案例:找出每个员工的部门名称,要求显示员工名,部门名?
# 1 select e.ename,d.dname, from emp e join dept d on e.deptno = d.deptno; # 2 select e.ename,(select d.dname from dept d where e.deptno = d.deptno) as dname from emp e;
-
注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果,多于1条,就报错了。!
union合并查询结果集
- 案例:查询工作岗位是MANAGER和SALESMAN的员工?
# 1
select
ename,job
from
emp
where
job = 'MANAGER' or job = 'SALESMAN';
# 2
select
ename,job
from
emp
where
job in('MANAGER','SALESMAN');
# 3
# MYSQL可以,oracle语法严格 ,不可以,报错。要求:结果集合并时列和列的数据类型也要一致。
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
- union的效率要高一些。对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍的翻。但是union可以减少匹配的次数。在减少匹配次数的情况下,还可以完成两个结果集的拼接。
- union可以理解为把乘法变成了加法运算
- union在进行结果集合并的时候,要求两个结果集的列数相同。
limit(非常重要)
-
将查询结果集的一部分取出来。通常使用在分页查询当中。
-
百度默认:一页显示10条记录。
-
分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差,可以一页一页翻页看。
案例:按照薪资降序,取出排名在前5名的员工?
select
ename,sal
from
emp
order by
sal desc
limit 0,5;
# 缺省用法:limit 5; 这是取前5.
# 完整用法:limit startIndex, length
# startIndex是起始下标,length是长度。起始下标从0开始
- 注意:mysql当中limit在order by之后执行
分页
每页显示3条记录
第1页:limit 0,3 [0 1 2]
第2页:limit 3,3 [3 4 5]
第3页:limit 6,3 [6 7 8]
第4页:limit 9,3 [9 10 11]
每页显示 pageSize 条记录
第pageNo页:limit (pageNo - 1) * pageSize , pageSize
public static void main(String[] args){
// 用户提交过来一个页码,以及每页显示的记录条数
int pageNo = 5; //第5页
int pageSize = 10; //每页显示10条
int startIndex = (pageNo - 1) * pageSize;
String sql = "select ...limit " + startIndex + ", " + pageSize;
}
DQL语句的总结
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
# 执行顺序
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit..
表的创建
-
(建表属于DDL语句,DDL包括:create drop alter )
create table 表名( 字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型 ); # 快速创建 create table 表名1 as select * from 表名; # 原理:将一个查询结果当做一张表新建,这个可以完成表的快速复制,表创建出来,同时表中的数据也存在了。
-
表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。
字段名:见名知意。
表名和字段名都属于标识符。 -
例:创建一个学生表
# 学号、姓名、年龄、性别、邮箱地址
create table t_student(
no int,
name varchar(32),
sex char(1),
age int(3),
email varchar(255)
);
# 删除表:
drop table t_student; # 当这张表不存在的时候会报错!
# 如果这张表存在的话,删除(更优的方式)
drop table if exists t_student;
数据类型
varchar(最长255)
可变长度的字符串
比较智能,节省空间。
会根据实际的数据长度动态分配空间。
优点:节省空间
缺点:需要动态分配空间,速度慢。
char(最长255)
定长字符串
不管实际的数据长度是多少。
分配固定长度的空间去存储数据。
使用不恰当的时候,可能会导致空间的浪费。
优点:不需要动态分配空间,速度快。
缺点:使用不当可能会导致空间的浪费。
varchar和char的选择
固定长度的字符串多选用char,例如:性别。
其余的选用varchar。
int(最长11)
数字中的整数型。等同于java的int。
bigint
数字中的长整型。等同于java中的long。
float
单精度浮点型数据
double
双精度浮点型数据
date
短日期类型
datetime
长日期类型
# date和datetime两个类型的区别
date是短日期:只包括年月日信息。
datetime是长日期:包括年月日时分秒信息。
mysql短日期默认格式:%Y-%m-%d
mysql长日期默认格式:%Y-%m-%d %h:%i:%s
mysql使用now() 函数获取系统当前时间:为datetime类型数据。
clob
Character Large OBject:CLOB
字符大对象
最多可以存储4G的字符串。
比如:存储一篇文章,存储一个说明。
超过255个字符的都要采用CLOB字符大对象来存储。
blob
Binary Large OBject
二进制大对象
专门用来存储图片、声音、视频等流媒体数据。
往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,你需要使用IO流才行。
对表结构的增删改
- 采用 **alter ** 来增加/删除/修改表结构,不影响表中的数据。
# 添加字段
alter table 表名 add 字段名 数据类型;
# 修改字段
alter table 表名 modify 字段名 数据类型;
# 删除字段
alter table 表名 drop 字段名;
- 表结构的增删改只需要了解,实际开发中极少使用,属于DDL语句。
- 第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。
修改表的结构,对应的java代码就需要进行大量的修改。成本是比较高的。
这个责任应该由设计人员来承担! - 第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天
真的要修改表结构,你可以使用工具!!!! - 修改表结构的操作是不需要写到java程序中的。实际上也不是java程序员的范畴。
插入数据insert (DML)
insert into 表名(字段名1,字段名2,字段名3,...)values(值1,值2,值3,...);
# 注意:字段名和值要一一对应,(数量要对应。数据类型要对应。)
# 一次可以插入多条记录:
insert into 表名(字段名1,字段名2,...) values
(值1,值2,值3,...),
(值1,值2,值3,...)
(值1,值2,值3,...);
-
注意:insert语句但凡是执行成功了,那么必然会多一条记录。若没有给其它字段指定值的话,默认值是NULL。
-
insert语句中的“字段名可以省略。
insert into 表名 values(值1,值2,值3,...); # 注意:前面的字段名省略的话,等于都写出了,所以值必须要都出。 # 不建议使用此种方式,因为当数据库表中的字段位置发生改变的时候会影响到insert语句
-
insert插入日期
# 数字格式化:format select ename,sal from emp; # 格式化数字:format(数字, '格式') select ename,format(sal, '$999,999') as sal from emp;
-
str_to_date:将字符串varchar类型转换成date类型。
-
date_format:将date类型转换成具有一定格式的varchar字符串类型。
birth date # 生日可以使用date日期类型
birth char(10) # 生日可以使用字符串,没问题。
# 生日:xxxx-xx-xx (10个字符)
- 注意:数据库中的有一条命名规范:所有的标识符都是全部小写,单词和单词之间使用下划线进行衔接。
insert into t_user(id,name,birth) values(1, 'zhangsan', '01-10-1990'); # 1990年10月1日
# 出问题了:原因是类型不匹配。数据库birth是date类型,这里给了一个字符串varchar。
# 可以使用str_to_date函数进行类型转换。
语法格式:
str_to_date('字符串日期', '日期格式')
# mysql的日期格式:
%Y 年 %m 月 %d 日
%h 时 %i 分 %s 秒
-
str_to_date
函数可以把字符串varchar转换成日期date类型数据,通常使用插入insert时,因为插入的时候需要一个日期类型的数据,需要通过该函数将字符串转换成date。注意:如果你提供的日期字符串是这个格式
(%Y-%m-%d)
,str_to_date函数就不需要了。 -
date_format
这个函数可以将日期类型转换成特定格式的字符串。这个函数通常使用在查询日期方面。设置展示的日期格式。自动将数据库中的date类型转换成varchar类型。并且采用的格式是mysql默认的日期格式:’%Y-%m-%d’
-
java中的日期格式:
yyyy-MM-dd HH:mm:ss SSS
select id,name,date_format(birth, '%m/%d/%Y') as birth from t_user;
查询结果插入到一张表当中【了解内容】
create table 表名1 as select * from 表名;
insert into 表名1 select * from 表名; # 很少用!
修改update(DML)
update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3... where 条件;
# 注意:没有条件限制会导致所有数据全部更新。
# 更新所有
update 表名 set 字段名=值;
删除数据 delete (DML)
delete from 表名 where 条件;
# 注意:没有条件,整张表的数据会全部删除!
delete from 表名;
# 删除所有!
快速删除表中的数据【重要】
delete语句删除数据的原理
- delete属于DML语句
- 表中的数据被删除,但是这个数据在硬盘上的真实存储空间不会被释放。
- 缺点:删除效率比较低。
- 优点:支持回滚,后悔了可以再恢复数据。
truncate语句删除数据的原理
-
这种操作属于DDL操作。
-
这种删除效率比较高,表被一次截断,物理删除。
-
缺点:不支持回滚。
-
优点:快速。
# 删除表中的数据
delete from 表名; # 这种删除数据的方式比较慢。
start transaction;
rollback;# 回滚操作。
# trunkcate删除操作
truncate table 表名;
表中有上亿条记录:
- 删除的时候,使用delete,也许需要执行1个小时才能删除完!效率较低。
- 可以选择使用truncate删除表中的数据。只需要不到1秒钟的时间就删除结束。效率较高。
- 但是使用truncate之前,必须仔细询问客户是否真的要删除,并警告删除之后不可恢复!
- truncate是删除表中的数据,表还在!
删除表操作
drop table 表名;
# 这不是删除表中的数据,这是把表删除。
约束(非常重要,五颗星*****)
- 约束:constraint
在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的完整性、有效性!!! - 约束的作用就是为了保证:表中的数据有效!!
约束包括
- 非空约束:not null
- 唯一性约束: unique
- 主键约束: primary key (简称PK)
- 外键约束:foreign key(简称FK)
- 检查约束:check(mysql不支持,oracle支持)
非空约束:not null
# 非空约束not null约束的字段不能为NULL。
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null # not null只有列级约束,没有表级约束!
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
insert into t_vip(id) values(3);
ERROR 1364 (HY000): Field 'name' doesn't have a default value
- 注:xxxx.sql这种文件被称为sql脚本文件。
sql脚本文件中编写了大量的sql语句。
我们执行sql脚本文件的时候,该文件中所有的sql语句会全部执行!
批量的执行SQL语句,可以使用sql脚本文件。
唯一性约束: unique
# 唯一性约束unique约束的字段不能重复,但是可以为NULL。
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique,
email varchar(255)
);
insert into t_vip(id,name,email) values(1,'zhangsan','zhangsan@123.com');
# name字段虽然被unique约束了,但是可以为NULL。
# 新需求:name和email两个字段联合起来具有唯一性!!!!
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique, # 约束直接添加到列后面的,叫做列级约束。
email varchar(255) unique
);
# 这张表这样创建是不符合我以上“新需求”的。这样创建表示:name具有唯一性,email具有唯一性。各自唯一。
#如果采用这种方式创建表的话,肯定创建失败,因为'zhangsan'和'zhangsan'重复了。
insert into t_vip(id,name,email) values(1,'zhangsan','zhangsan@123.com');
insert into t_vip(id,name,email) values(2,'zhangsan','zhangsan@sina.com');
# 以下这样的数据是符合我“新需求”的
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
email varchar(255),
unique(name,email) # 约束没有添加在列的后面,这种约束被称为表级约束。
);
insert into t_vip(id,name,email) values(1,'zhangsan','zhangsan@123.com');
insert into t_vip(id,name,email) values(2,'zhangsan','zhangsan@sina.com');
# name和email两个字段联合起来唯一!!!
- 什么时候使用表级约束呢?
需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束。
unique 和not null可以联合吗
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null unique
);
desc t_vip;
+-------+--------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------+--------------+------+-----+---------+-------+
| id | int(11) | YES | | NULL | |
| name | varchar(255) | NO | PRI | NULL | |
+-------+--------------+------+-----+---------+-------+
# 在mysql当中,如果一个字段同时被not null和unique约束的话,
# 该字段自动变成主键字段。(注意:oracle中不一样!)
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'zhangsan'); # 错误:name不能重复
insert into t_vip(id) values(2); # 错误:name不能为NULL。
主键约束(primary key,简称PK)重要
-
主键约束的相关术语
主键约束:就是一种约束。
主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段
主键值:主键字段中的每一个值都叫做:主键值。 -
主键值是每一行记录的唯一标识。
-
记住:任何一张表都应该有主键,没有主键,表无效!
-
主键的特征:not null + unique(主键值不能是NULL,同时也不能重复!)
添加主键-----列级约束
# 怎么给一张表添加主键约束呢?
drop table if exists t_vip;
# 1个字段做主键,叫做:单一主键
create table t_vip(
id int primary key, # 列级约束
name varchar(255)
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
insert into t_vip(id,name) values(2,'wangwu'); # 错误:不能重复
ERROR 1062 (23000): Duplicate entry '2' for key 'PRIMARY'
insert into t_vip(name) values('zhaoliu'); # 错误:不能为NULL
ERROR 1364 (HY000): Field 'id' doesn't have a default value
添加主键-----表级约束
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
primary key(id) # 表级约束
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(1,'lisi'); # 错误
ERROR 1062 (23000): Duplicate entry '1' for key 'PRIMARY'
- 表级约束主要是给多个字段联合起来添加约束
drop table if exists t_vip;
# id和name联合起来做主键:复合主键!!!!
create table t_vip(
id int,
name varchar(255),
email varchar(255),
primary key(id,name)
);
insert into t_vip(id,name,email) values(1,'zhangsan','zhangsan@123.com');
insert into t_vip(id,name,email) values(1,'lisi','lisi@123.com');# 错误:不能重复
ERROR 1062 (23000): Duplicate entry '1-lisi' for key 'PRIMARY'
-
在实际开发中不建议使用:复合主键。建议使用单一主键,因为主键值存在的意义就是这行记录的身份证号,只要意义达到即可,单一主键可以做到。
-
复合主键比较复杂,不建议使用!
-
一个表中主键约束能加两个吗?
drop table if exists t_vip;
create table t_vip(
id int primary key,
name varchar(255) primary key
);
ERROR 1068 (42000): Multiple primary key defined
# 结论:一张表,主键约束只能添加1个。(主键只能有1个。)
- 主键值建议使用
int、bigint、char
等类型。 - 不建议使用:varchar来做主键。主键值一般都是数字,一般都是定长的!
主键的其它分类
-
自然主键:主键值是一个自然数,和业务没关系。
-
业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值。这就是业务主键!
-
在实际开发中使用业务主键多,还是使用自然主键多一些?
- 自然主键使用比较多,因为主键只要做到不重复就行,不需要有意义。
- 业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候,可能会影响到主键值,所以业务主键不建议使用。尽量使用自然主键。
-
在mysql当中,有一种机制,可以帮助我们自动维护一个主键值?
drop table if exists t_vip;
create table t_vip(
id int primary key auto_increment, # auto_increment表示自增,从1开始,以1递增!
name varchar(255)
);
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
select * from t_vip;
+----+----------+
| id | name |
+----+----------+
| 1 | zhangsan |
| 2 | zhangsan |
| 3 | zhangsan |
| 4 | zhangsan |
| 5 | zhangsan |
| 6 | zhangsan |
| 7 | zhangsan |
| 8 | zhangsan |
+----+----------+
外键约束(foreign key,简称FK)重要
- 外键约束涉及到的相关术语:
外键约束:一种约束(foreign key)
外键字段:该字段上添加了外键约束
外键值:外键字段当中的每一个值。 - 业务背景:
请设计数据库表,来描述“班级和学生”的信息?
# 第一种方案:班级和学生存储在一张表中
t_student
no(pk) name classno classname
----------------------------------------------------------------------------------
1 jack 100 北京市大兴区亦庄镇第二中学高三1班
2 lucy 100 北京市大兴区亦庄镇第二中学高三1班
3 lilei 100 北京市大兴区亦庄镇第二中学高三1班
4 hanmeimei 100 北京市大兴区亦庄镇第二中学高三1班
5 zhangsan 101 北京市大兴区亦庄镇第二中学高三2班
6 lisi 101 北京市大兴区亦庄镇第二中学高三2班
7 wangwu 101 北京市大兴区亦庄镇第二中学高三2班
8 zhaoliu 101 北京市大兴区亦庄镇第二中学高三2班
# 分析以上方案的缺点:
# 数据冗余,空间浪费!
# 第二种方案:班级一张表、学生一张表
t_class 班级表
classno(pk) classname
------------------------------------------------------
100 北京市大兴区亦庄镇第二中学高三1班
101 北京市大兴区亦庄镇第二中学高三1班
t_student 学生表
no(pk) name cno(FK引用t_class这张表的classno)
----------------------------------------------------------------
1 jack 100
2 lucy 100
3 lilei 100
4 hanmeimei 100
5 zhangsan 101
6 lisi 101
7 wangwu 101
8 zhaoliu 101
# 当cno字段没有任何约束的时候,可能会导致数据无效。可能出现一个102,但是102班级不存在。所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
# 那么:cno字段就是外键字段。cno字段中的每一个值都是外键值。
#注意:t_class是父表,t_student是子表
-
删除表的顺序:先删子,再删父。
-
创建表的顺序:先创建父,再创建子。
-
删除数据的顺序:先删子,再删父。
-
插入数据的顺序:先插入父,再插入子。
-
思考:子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗?
不一定是主键,但至少具有unique约束。 -
注意:外键值可以为NULL。
查询MySQL数据库编码
show variables like 'character%';
# 8.0.25 支持中文字段。
存储引擎(了解内容)
- 存储引擎是MySQL中特有的一个术语,其它数据库中没有。(Oracle中有,但是不叫这个名字)
存储引擎是一个表存储/组织数据的方式,不同的存储引擎,表存储数据的方式不同。
怎么给表添加/指定“存储引擎”
show create table t_student;
# 可以在建表的时候给表指定存储引擎。
CREATE TABLE `t_student` (
`no` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) DEFAULT NULL,
`cno` int(11) DEFAULT NULL,
PRIMARY KEY (`no`),
KEY `cno` (`cno`),
CONSTRAINT `t_student_ibfk_1` FOREIGN KEY (`cno`) REFERENCES `t_class` (`classno`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
- 结论:(注:版本不同默认的存储引擎和字符编码方式不一定相同,这里使用的是8.0.25版本)
mysql默认的存储引擎是:InnoDB
mysql默认的字符编码方式是:utf8mb4 - 在建表的时候可以在最后小括号的")"的右边使用:ENGINE来指定存储引擎。CHARSET来指定这张表的字符编码方式。
# 建表时指定存储引擎,以及字符编码方式。
create table t_product(
id int primary key,
name varchar(255)
)engine=InnoDB default charset=gbk;
查看数据库的版本号,以及所拥有的数据引擎。
select version();# 查看数据库的版本号
+-----------+
| version() |
+-----------+
| 8.0.25 |
+-----------+
# 查看MySQL支持的数据引擎
show engines \G
- mysql支持九大存储引擎,当前8.0.25版本支持8个,版本不同支持情况不同。
************************** 1. row ***************************
Engine: MEMORY
Support: YES
...
*************************** 2. row ***************************
Engine: MRG_MYISAM
Support: YES
...
*************************** 3. row ***************************
Engine: CSV
Support: YES
...
*************************** 4. row ***************************
Engine: FEDERATED
Support: NO # 不支持
...
*************************** 5. row ***************************
Engine: PERFORMANCE_SCHEMA
Support: YES
...
*************************** 6. row ***************************
Engine: MyISAM
Support: YES
...
*************************** 7. row ***************************
Engine: InnoDB
Support: DEFAULT # 默认
...
*************************** 8. row ***************************
Engine: BLACKHOLE
Support: YES
...
*************************** 9. row ***************************
Engine: ARCHIVE
Support: YES
...
mysql常用的存储引擎
MyISAM存储引擎
-
它管理的表具有以下特征:
使用三个文件表示每个表:
格式文件 — 存储表结构的定义(mytable.frm)
数据文件 — 存储表行的内容(mytable.MYD)
索引文件 — 存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。可被转换为压缩、只读表来节省空间。 -
提示:
对于一张表来说,只要是主键,
或者加有unique约束的字段上会自动创建索引。 -
MyISAM存储引擎特点:
可被转换为压缩、只读表来节省空间,这是这种存储引擎的优势 -
MyISAM不支持事务机制,安全性低。
InnoDB存储引擎
-
mysql默认的存储引擎,同时也是一个重量级的存储引擎。
InnoDB支持事务,支持数据库崩溃后自动恢复机制。
InnoDB存储引擎最主要的特点是:非常安全。 -
它管理的表具有下列主要特征:
– 每个 InnoDB 表在数据库目录中以.frm 格式文件表示
– InnoDB 表空间 tablespace 被用于存储表的内容(表空间是一个逻辑名称。表空间存储数据+索引。) – 提供一组用来记录事务性活动的日志文件
– 用 COMMIT(提交)、SAVEPOINT 及ROLLBACK(回滚)支持事务处理
– 提供全 ACID 兼容
– 在 MySQL 服务器崩溃后提供自动恢复
– 多版本(MVCC)和行级锁定
– 支持外键及引用的完整性,包括级联删除和更新 -
InnoDB最大的特点就是支持事务:
可以保证数据的安全。效率不是很高,并且也不能压缩,不能转换为只读,
不能很好的节省存储空间。
MEMORY存储引擎
-
使用 MEMORY 存储引擎的表,其数据存储在内存中,且行的长度固定,这两个特点使得 MEMORY 存储引擎非常快。
-
MEMORY 存储引擎管理的表具有下列特征:
– 在数据库目录内,每个表均以.frm 格式的文件表示。
– 表数据及索引被存储在内存中。(目的就是快,查询快!)
– 表级锁机制。
– 不能包含 TEXT 或 BLOB 字段。 -
MEMORY 存储引擎以前被称为HEAP 引擎。
-
MEMORY引擎优点:查询效率是最高的。不需要和硬盘交互。
-
MEMORY引擎缺点:不安全,关机之后数据消失。因为数据和索引都是在内存当中。
事务(重点:掌握)
什么是事务
-
事务对应的英语单词是:transaction
-
一个事务其实就是一个完整的业务逻辑,是一个最小的工作单元,不可再分。
- 什么是一个完整的业务逻辑?
假设转账,从A账户向B账户中转账10000.
将A账户的钱减去10000(update语句)
将B账户的钱加上10000(update语句)
这就是一个完整的业务逻辑。 - 以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。
- 这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。
- 什么是一个完整的业务逻辑?
只有DML语句才会有事务
insert delete update
-
只有以上的三个语句和事务有关系,其它都没有关系。
-
因为 只有以上的三个语句是数据库表中数据进行增、删、改的。
-
只要你的操作一旦涉及到数据的增、删、改,那么就一定要考虑安全问题。数据安全第一位!
假设所有的业务,只要一条DML语句就能完成,还有必要存在事务机制吗?
-
正是因为做某件事的时候,需要多条DML语句共同联合起来才能完成,所以需要事务的存在。如果任何一件复杂的事儿都能一条DML语句搞定,那么事务则没有存在的价值了。
-
到底什么是事务呢?
说到底,说到本质上,一个事务其实就是多条DML语句同时成功,或者同时失败! -
事务:就是批量的DML语句同时成功,或者同时失败!
事务是怎么做到多条DML语句同时成功和同时失败的呢?
# InnoDB存储引擎:提供一组用来记录事务性活动的日志文件
# 事务开启了:
insert
insert
insert
delete
update
update
update
# 事务结束了!
-
在事务的执行过程中,每一条DML的操作都会记录到“事务性活动的日志文件”中。
-
在事务的执行过程中,我们可以提交事务,也可以回滚事务。
-
提交事务?
清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。
提交事务标志着,事务的结束。并且是一种全部成功的结束。 -
回滚事务?
将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件
回滚事务标志着,事务的结束。并且是一种全部失败的结束。
怎么提交事务,怎么回滚事务?
- 提交事务:
commit;
语句 - 回滚事务:
rollback;
语句(回滚永远都是只能回滚到上一次的提交点!) - mysql默认情况下是支持自动提交事务的。(自动提交)
- 自动提交:每执行一条DML语句,则提交一次!
- 这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据
的安全,必须要求同时成功之后再提交,所以不能执行一条就提交一条。
关闭mysql的自动提交机制
# 先执行这个命令:
start transaction;
演示事务:
---------------------------------回滚事务----------------------------------------
mysql> use bjpowernode;
mysql> select * from dept_bak;
Empty set (0.00 sec)
mysql> start transaction;
mysql> insert into dept_bak values(10,'abc', 'tj');
mysql> insert into dept_bak values(10,'abc', 'tj');
mysql> select * from dept_bak;
+--------+-------+------+
| DEPTNO | DNAME | LOC |
+--------+-------+------+
| 10 | abc | tj |
| 10 | abc | tj |
+--------+-------+------+
2 rows in set (0.00 sec)
mysql> rollback;
Query OK, 0 rows affected (0.00 sec)
mysql> select * from dept_bak;
Empty set (0.00 sec)
---------------------------------提交事务----------------------------------------
mysql> use bjpowernode;
mysql> select * from dept_bak;
+--------+-------+------+
| DEPTNO | DNAME | LOC |
+--------+-------+------+
| 10 | abc | bj |
+--------+-------+------+
mysql> start transaction;
mysql> insert into dept_bak values(20,'abc','tj')
mysql> insert into dept_bak values(20,'abc','tj')
mysql> commit;
mysql> select * from dept_bak;
+--------+-------+------+
| DEPTNO | DNAME | LOC |
+--------+-------+------+
| 10 | abc | bj |
| 20 | abc | tj |
| 20 | abc | tj |
+--------+-------+------+
mysql> rollback;
mysql> select * from dept_bak;
+--------+-------+------+
| DEPTNO | DNAME | LOC |
+--------+-------+------+
| 10 | abc | bj |
| 20 | abc | tj |
| 20 | abc | tj |
+--------+-------+------+
事务包括4个特性
-
A:原子性 说明事务是最小的工作单元。不可再分。
-
C:一致性 所有事务要求,在同一个事务当中,所有操作必须同时成功,或者同时失败,以保证数据的一致性。
-
I:隔离性 A事务和B事务之间具有一定的隔离。教室A和教室B之间有一道墙,这道墙就是隔离性。
-
D:持久性 事务最终结束的一个保障。事务提交,就相当于将没有保存到硬盘上的数据保存到硬盘上。
事务的隔离性
- 事务和事务之间的4个隔离级别
- 例:A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄。这就是事务的隔离级别,这道墙越厚,表示隔离级别就越高。
读未提交:
-
read uncommitted(最低的隔离级别)
-
什么是读未提交?
- 没有提交就读到了
- 事务A可以读取到事务B未提交的数据。
-
这种隔离级别存在的问题:
- 脏读现象!(Dirty Read),我们称读到了脏数据。
- 这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!
读已提交:
-
read committed
-
什么是读已提交?
- 提交之后才能读到
- 事务A只能读取到事务B提交之后的数据。
-
这种隔离级别解决了什么问题?
- 解决了脏读的现象。
-
这种隔离级别存在什么问题?
- 不可重复读取数据。
-
什么是不可重复读取数据呢?
- 在事务开启之后,第一次读到的数据是3条,当前事务还没有结束,可能第二次再读取的时候,读到的数据是4条,3不等于4称为不可重复读取。
-
这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。
- oracle数据库默认的隔离级别是:read committed
可重复读:
-
repeatable read
-
什么是可重复读取?
- 提交之后也读不到,永远读取的都是刚开启事务时的数据
- 事务A开启之后,不管是多久,每一次在事务A中读取到的数据都是一致的。即使事务B将数据已经修改,并且提交了,事务A读取到的数据还是没有发生改变,这就是可重复读。
-
可重复读解决了什么问题?
- 解决了不可重复读取数据。
-
可重复读存在的问题是什么?
- 可以会出现幻影读。
- 每一次读取到的数据都是幻象。不够真实!
- mysql中默认的事务隔离级别就是这个
序列化/串行化:
- serializable最高的隔离级别
- 这是最高隔离级别,效率最低,解决了所有的问题。
- 这种隔离级别表示事务排队,不能并发!
- synchronized,线程同步(事务同步每一次读取到的数据都是最真实的,并且效率是最低的。)
验证各种隔离级别
- 查看隔离级别:
select @@transaction_isolation;
+-------------------------+
| @@transaction_isolation |
+-------------------------+
| REPEATABLE-READ |
+-------------------------+
- 被测试的表t_user
- 验证:read uncommited
mysql> set global transaction isolation level read uncommitted;
事务A 事务B
use bjpowernode; use bjpowernode;
start transaction; start transaction;
select * from t_user;
insert into t_user values('zhangsan'); select * from t_user;
- 验证:read commited
mysql> set global transaction isolation level read committed;
事务A 事务B
use bjpowernode; use bjpowernode;
start transaction; start transaction;
select * from t_user; insert into t_user values('zhangsan');
select * from t_user; commit;
select * from t_user;
- 验证:repeatable read
mysql> set global transaction isolation level repeatable read;
事务A 事务B
use bjpowernode; use bjpowernode;
start transaction; start transaction;
select * from t_user; insert into t_user values('lisi');
insert into t_user values('wang');
commit;
select * from t_user;
- 验证:serializable
mysql> set global transaction isolation level serializable;
事务A 事务B
use bjpowernode; use bjpowernode;
start transaction; start transaction;
select * from t_user;
insert into t_user values('abc');
select * from t_user;
索引(index)
索引的概念
-
索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。
-
索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。(缩小扫描范围,其实就是扫描某个区间罢了。)
-
没有索引,MySQL 不得不首先以第一条记录开始,然后读完整个表直到它找出相关的行。
-
MySQL在查询方面主要就是两种方式:
第一种方式:全表扫描
第二种方式:根据索引检索。 (索引检索,效率较高。)
-
在mysql数据库当中索引也是需要排序的,并且这个所以的排序TreeSet
数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql当中索引是一个B-Tree数据结构。 -
遵循左小右大原则存放。采用中序遍历方式遍历取数据。
-
表越大,花费时间越多。对于一个 有序字段,可以运用二分查找(Binary Search),这就是为什么性能能得到本质上的提高。MYISAM 和 INNODB 都是用 B+Tree 作为索引结构 。
索引的实现原理
-
提醒1:在任何数据库当中主键上都会自动添加索引对象。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
-
提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
-
提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式存在,在MyISAM存储引擎中,索引存储在一个
.MYI
文件中。在InnoDB存储引擎中索引存储在一个逻辑名称叫做tablespace
的当中。在MEMORY存储引擎当中索引被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式存在。(自平衡二叉树:B-Tree)
什么条件下,我们会考虑给字段添加索引
-
条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同)
-
条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描。
-
条件3:该字段很少的DML(insert delete update)操作。(因为DML之后,索引需要重新排序。)
-
建议1:不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。
-
建议2:通过主键查询和unique约束的字段进行查询,效率是比较高的。
索引的创建和删除
创建索引:
create index emp_ename_index on emp(ename);
# 给emp表的ename字段添加索引,起名:emp_ename_index
删除索引:
drop index emp_ename_index on emp;
# 将emp表上的emp_ename_index索引对象删除。
查看一个SQL语句是否使用了索引进行检索
explain select * from emp where ename = 'KING';
# 扫描14记录(rows = 14):说明没有使用索引。type=ALL
# 扫描1记录(rows = 1):说明使用索引。type=ref
索引失效
失效的第1种情况:
select * from emp where ename like '%T';
+------+------+
|type | rows |
+------+------+
| ALL | 14 |
+------+------+
-
ename上即使添加了索引,也不会走索引,为什么?
原因是因为模糊匹配当中以“%”开头了。
尽量避免模糊查询的时候以“%”开始,这是一种优化的手段/策略。
失效的第2种情况:
mysql> explain select * from emp where ename = 'KING' or job = 'MANAGER';
+------+------+
| type | rows |
+----+--------+
| ALL | 14 |
+----+--------+
- 使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个
字段上的索引也会实现。所以这就是为什么不建议使用or的原因。
失效的第3种情况:
create index emp_job_sal_index on emp(job,sal);
explain select * from emp where job = 'MANAGER';
+------+------+
| type | rows |
+----+--------+
| ref | 3 |
+------+------+
explain select * from emp where sal = 800;
+------+------+
| type | rows |
+------+------+
| ALL | 14 |
+------+------+
- 使用复合索引的时候,没有使用左侧的列查找,索引失效
什么是复合索引?
两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。
失效的第4种情况:
create index emp_sal_index on emp(sal);
explain select * from emp where sal = 800;
+------+------+
| type | rows |
+------+------+
| ref | 1 |
+------+------+
explain select * from emp where sal+1 = 800;
+------+------+
| type | rows |
+------+------+
| ALL | 14 |
+------+------+
- 在where当中索引列参加了运算,索引失效。
失效的第5种情况:
explain select * from emp where lower(ename) = 'smith';
+------+------+
| type | rows |
+------+------+
| ALL | 14 |
+------+------+
- 在where当中索引列使用了函数。
索引在数据库当中的分类:
- 单一索引:一个字段上添加索引。
- 复合索引:两个字段或者更多的字段上添加索引。
- 主键索引:主键上添加索引。
- 唯一性索引:具有unique约束的字段上添加索引。
… - 注意:唯一性比较弱的字段上添加索引用处不大。
- 索引是各种数据库进行优化的重要手段。优化的时候优先考虑的因素就是索引。
视图(view)
- view:站在不同的角度去看待同一份数据。
创建和删除视图对象
- 创建视图对象:
create table dept2 as select * from dept;# 表复制
create view dept2_view as select * from dept2;
- 删除视图对象:
drop view dept2_view;
- 注意:只有DQL语句才能以view的形式创建。
create view view_name as (这里的语句必须是DQL语句);
面向视图对象进行增删改查
我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致
原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。
# 面向视图查询
select * from dept2_view;
# 面向视图插入
insert into dept2_view(deptno,dname,loc)values(60,'SALES', 'BEIJING');
# 面向视图删除
delete from dept2_view;
# 查询原表数据
select * from dept2;
# 创建视图对象
create view
emp_dept_view
as
select
e.ename,e.sal,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
# 面向视图更新
update emp_dept_view set sal = 1000 where dname = 'ACCOUNTING';
# 查询视图对象
select * from emp_dept_view;
# 原表数据被更新
select * from emp;
视图对象在实际开发中的应用
create view
emp_dept_view
as
select
e.ename,e.sal,d.dname
from
emp e
join
dept d
on
e.deptno = d.deptno;
-
方便,简化开发,利于维护
-
假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办?
可以把这条复杂的SQL语句以视图对象的形式新建。
在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发,并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。 -
我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。
可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是
存储在硬盘上的,不会消失。 -
注意:
视图对应的语句只能是DQL语句。
但是视图对象创建完成之后,可以对视图进行增删改查等操作。 -
增删改查,又叫做:CRUD。
C:Create(增)
R:Retrive(查:检索)
U:Update(改)
D:Delete(删)
DBA常用命令
数据的导入和导出(数据的备份)
数据导出
- 注意:在windows的dos命令窗口中:
mysqldump 库名>绝对路径\.sql文件 -u用户名 -p密码
# 导出指定的表
mysqldump 库名 表名>绝对路径绝对路径\.sql文件 -u用户名 -p密码
数据导入
- 注意:需要先登录到mysql数据库服务器上。
# 创建数据库:
create database 库名;
# 使用数据库:
use 库名
# 初始化数据库:
source 绝对路径绝对路径\.sql文件
数据库设计三范式
-
数据库表的设计依据。
-
第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。
-
第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,不要产生部分依赖。
-
第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,不要产生传递依赖。
-
设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。
第一范式
- 最核心,最重要的范式,所有表的设计都需要满足。
学生编号 学生姓名 联系方式
------------------------------------------
1001 张三 zs@gmail.com,1359999999
1002 李四 ls@gmail.com,13699999999
1001 王五 ww@163.net,13488888888
# 以上是学生表,满足第一范式吗?
不满足,第一:没有主键。第二:联系方式可以分为邮箱地址和电话
学生编号(pk) 学生姓名 邮箱地址 联系电话
----------------------------------------------------
1001 张三 zs@gmail.com 1359999999
1002 李四 ls@gmail.com 13699999999
1003 王五 ww@163.net 13488888888
第二范式:
- 建立在第一范式的基础之上,要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
学生编号 学生姓名 教师编号 教师姓名
----------------------------------------------------
1001 张三 001 王老师
1002 李四 002 赵老师
1003 王五 001 王老师
1001 张三 002 赵老师
# 这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生) 多对多关系!
# 分析以上的表是否满足第一范式?不满足第一范式。
学生编号+教师编号(pk) 学生姓名 教师姓名
----------------------------------------------------
1001 001 张三 王老师
1002 002 李四 赵老师
1003 001 王五 王老师
1001 002 张三 赵老师
# 学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号)
# 经过修改之后,以上的表满足了第一范式。但是满足第二范式吗?
# 不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。
学生表
学生编号(pk) 学生名字
------------------------------------
1001 张三
1002 李四
1003 王五
教师表
教师编号(pk) 教师姓名
--------------------------------------
001 王老师
002 赵老师
学生教师关系表
id(pk) 学生编号(fk) 教师编号(fk)
------------------------------------------------------
1 1001 001
2 1002 002
3 1003 001
4 1001 002
- 产生部分依赖有的缺点:数据冗余。空间浪费了。
- 多对多的设计思路:多对多,三张表,关系表两个外键。
第三范式
- 第三范式建立在第二范式的基础之上,要求所有非主键字典必须直接依赖主键,不要产生传递依赖。
学生编号(PK)学生姓名 班级编号 班级名称
-------------------------------------
1001 张三 01 一年一班
1002 李四 02 一年二班
1003 王五 03 一年三班
1004 赵六 03 一年三班
# 以上表的设计是描述:班级和学生的关系。很显然是1对多关系!一个教室中有多个学生。
# 分析以上表是否满足第一范式?满足第一范式,有主键。
# 分析以上表是否满足第二范式?满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。
# 分析以上表是否满足第三范式?第三范式要求:不要产生传递依赖!
# 一年一班依赖01,01依赖1001,产生了传递依赖。
# 不符合第三范式的要求。产生了数据的冗余。
班级表:一
班级编号(pk) 班级名称
----------------------------------------
01 一年一班
02 一年二班
03 一年三班
学生表:多
学生编号(PK) 学生姓名 班级编号(fk)
-------------------------------------------
1001 张三 01
1002 李四 02
1003 王五 03
1004 赵六 03
- 一对多,两张表,多的表加外键。
总结表的设计
-
一对多:一对多,两张表,多的表加外键。
-
多对多:多对多,三张表,关系表两个外键。
-
一对一:口诀:一对一,外键唯一。
在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。
# 一对一怎么设计?
# 没有拆分表之前:一张表
t_user
id login_name login_pwd real_name email address........
---------------------------------------------------------------------------
1 zhangsan 123 张三 zhangsan@xxx
2 lisi 123 李四 lisi@xxx
...
# 这种庞大的表建议拆分为两张:
t_login 登录信息表
id(pk) login_name login_pwd
---------------------------------
1 zhangsan 123
2 lisi 123
t_user 用户详细信息表
id(pk) real_name email address........ login_id(fk+unique)
----------------------------------------------------------------------------------------
100 张三 zhangsan@xxx 1
200 李四 lisi@xxx 2
注:
-
数据库设计三范式是理论上的。
-
实践和理论有的时候有偏差。
-
最终的目的都是为了满足客户的需求,有的时候会拿冗余换执行速度。
-
因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)
-
有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的,
-
并且对于开发人员来说,sql语句的编写难度也会降低。