第一天
1. 什么是数据库?什么是数据库管理系统?什么是sql?它们之间的关系是什么?
数据库:
英文单词DataBase,简称DB。按照一定格式存储数据的一些文件的组合。
顾名思义:存储数据的仓库,实际上就是一堆文件。这些文件中存储了具有特定格式的数据。
数据库管理系统:
DataBaseManagement,简称DBMS
数据库管理系统是专门用来管理数据库中的数据,数据库管理系统可以对数据库当中的数据进行增删改查。
常见的数据库管理系统:
Mysql、Oracle、MS SqlServer、DB2、sybase等…
SQL:结构化查询语言
程序员需要学习SQL语句,程序员通过编写SQL语句,然后DBMS负责执行SQL语句,最终来完成数据库中数据的增删改查操作.
SQL是一套标准,程序员主要学习的就是SQL语句,这个SQL在mysql中可以使用,同时在Oracle中也可以使用,在DB2中也可以使用。
三者之间的关系?
DBMS–执行–>SQL–操作–>DB
先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS对SQL语句进行执行,最终来完成数据库的数据管理。
2. 安装MySQL数据库管理系统
注意事项:
端口号:
端口号port是任何一个软件/应用都会有的,端口号是应用的唯一代表。端口号通常和ip地址在一块,ip地址用来定位计算机的,端口号port是用来定位计算机上某个服务/某个应用的!
在同一台计算机上,端口号不能重复,具有唯一性。
Mysql数据库启动的时候,这个服务占有的默认端口号是3306。
字符编码方式:
设置mysql数据库的字符编码方式为utf8
服务名称:
默认是Mysql,不需要改。
选择配置环境变量path,也可以手动配置。
设置密码的同时,可以激活root账户远程访问。
激活:表示root账号可以在外地登录。
不激活:表示root账号只能在本机上使用。
Mysql数据库的完美卸载
- 双击安装包进行删除。
- 删除目录,在C盘下的Program(X86)的Mysql文件夹,以及ProgramData下的Mysql目录删除。
Mysql的服务
启动,暂停,自动,默认配置。
在windows操作系统中,怎么用命令来启动和关闭mysql服务?
net stop 服务名称(MySQL)(停止服务)
net start 服务名称(MySQL)(开启服务)
其他服务启停都可以采用以上命令。
登录
- (显示密码形式)
cmd命令行中输入命令:mysql -uroot -p123456 - (隐藏密码形式)
cmd命令行中输入命令:mysql -uroot -p
常用命令(不区分大小写)
- 退出mysql:exit
- 查看mysql中有哪些数据库:show databases;
(mysql默认自带四个数据库) - 选择使用某个数据库:use 数据库名;
- 创建数据库:create database 数据库名;
- 查看某个数据库下有哪些表:show tables;
- 不看表数据,只看表结构:desc 表名;
- varchar就是Java中的String
- 不见分号不执行。
- 终止:\c
- 查看Mysql数据库版本号:select version();
- 查看当前用的数据库:select database;
什么是表table?为什么用表来存储数据呢?
- 数据库当中最基本的单元是表:table
- 数据库当中是以表格的形式表示数据的。因为表比较直观。
- 任何一张表都有行和列, 行(row):被称为数据/记录。 列(column):被称为字段。
- 每个字段都有:字段名、数据类型、约束等属性。
- 数据类型:字符串、数字、日期。。。。
- 约束:约束有很多,其中一个叫唯一性约束,这种约束添加之后,该字段中的数据不能重复。
关于SQL语句的分类?
sql语句有很多,最好进行分门别类,这样容易记忆。
- DQL:数据查询语言(凡是带有select关键字的都是查询语句)select…
- DML:数据操作语言(凡是对表当中的数据进行增删改的都是DML)insert增 delete删 update改
- DDL:数据定义语言(凡是带有create、drop、alter的都是DDL)DDL主要操作的是表的结构,不是表中的数据。 create:新建,等同于增 drop:删除 alter:修改 这个增删改和DML不同,这个主要是对表结构进行操作。
- TCL:是事务控制语言, 包括事务提交:commit; 事务回滚:rollback;
- DCL:数据控制语言; 例如:授权grant、撤销权限revoke…
数据导入
- (导入数据)输入命令方式:source 路径(路径中不能有中文)
- dept是部门表
- emp是员工表
- salgrade是工资等级表
- 怎么查看表中的数据?
- select * from 表名;
简单查询
- 查询一个字段 select 字段名 from 表名;
- 其中要注意:
- select和from都是关键字。
- 字段名和表名都是标识符。
- 强调:sql语句不区分大小写。
- 查询两个字段,或者多个字段 :用逗号隔开。
- 查询所有字段,可以把每个字段都写上,或者使用*号
给查询列起别名
- 可以用as关键字
SELECT DEPTNO,DNAME AS DEPTNAME FROM DEPT;
- 可以使用空格代替
- 可以添加单/双引号括起来
- 注意:在所有的数据库当中,字符串统一使用单引号括起来,单引号是标准,双引号在oracle数据库中用不了,但是在Mysql中可以使用。
- 别名是中文,用单引号括起来。
条件查询
- select 字段1,字段2,字段3。。。。
- from 表名
- where 条件;
- 使用between…and…遵循左小右大
- between…and…闭区间
- is null 为 null(is not null 不为空)
- 在数据库当中null不能使用等号进行衡量。要使用is null,因为数据库中的null代表什么也没有,他不是一个值,所以不能使用等号衡量。
- and并且
- or或者
- and和or同时出现,and优先级较高。如过想让or先执行,需要加小括号,如果不确定优先级,就加小括号。
- in包含,相当于多个和or(not in 不在这个范围中)
- 注意:in不是一个区间,in后面跟的是具体的值。
- not 可以取非,主要用在is或in中
- like 称谓模糊查询,支持%或者下划线匹配
- %:匹配任意多个字符
- 下划线:任意一个字符
- 找出名字带有下划线的,因为下划线代表特定内容,所以要加上斜杠 \,进行转义。
排序
- order by(默认升序)
- desc是降序,指定按照什么进行排序,比如:工资 desc;
- asc是升序,同上。
多个字段排序
- 例:查询员工名字和薪资,要求按照薪资升序,如果薪资一样,再按照名字升序排列。
select ename,sal
from emp
order by sal asc,ename asc;
//sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序
了解:根据字段位置进行排序
select ename,sal
from emp
order by 2;
//2表示第二列,第二列目前是sal,按照查询结果的第二列sal排序。
//了解一下即可,不建议在开发中这样写,因为不健壮。
</br>
//列的顺序很容易发生改变,列顺序改变之后,2就费了
格式
select
...
from
...
where
...
order by
...;
第一步:from
第二步:where
第三步:select
第四步:order by(排序总在最后执行!)
数据处理函数(单行处理函数)
- 数据处理函数又被称为单行处理函数
- 单行处理函数的特点:一个输入对应一个输出。
- 和单行处理函数相对的是:多行处理函数。 (多行处理函数特点:多个输入,对应1个输出!)
- 多少个输入,最后就是多少个输出,这是单行处理函数的特点。
- 单行处理函数常见的有哪些
- lower:转小写
- upper:转大写
- substr(被截取的字符串,起始下标,截取的长度):取子串(起始下标从1开始)
- concat:函数进行字符串的拼接
- length:取长度
- trim:去空格
- round:四舍五入
- rand:生成随机数
- ifnull:空处理函数,专门用于处理空的。(可以将null转换成一个具体值)
- case…when…then…when…then…else…end
- str_to_date:将字符串转换成日期
- date_format:格式化日期
- format:设置千分位
例:
1. 转小写:lower
select lower(ename) as ename from emp;
2. 转大写:upper
select upper(ename) as ename from emp;
3. 取子串:substr
找出员工名字第一个字母是A的员工信息?
3.1 第一种方式(模糊查询):
select ename
from emp
where ename like 'A%';
3.2 第二种方式(substr函数):
select ename
from emp
where substr(ename,1,1) = 'A';
4. 首字母大写?
4.1. select name from t_student;
4.2. select upper(substr(name,1,1)) form t_student;
4.3. select substr(name,2,length(name)-1) from t_student;
4.4. select concat(upper(substr(name,1,1)),substr(name,2,length(name)-1)) as result from t_student;
5. 字符串拼接:concat
select concat(empno,ename) from emp'
6. 取长度:length
select length(ename) enamelength from emp;
7. 去空格:trim
7.1 select *
from emp
where ename = ' KING';
7.2 select *
from emp
where ename = trim(' KING');
8. 四舍五入:round
8.1 select 字段 from 表名;
select ename from emp;
8.2 select 'abc' from emp;//select后面直接跟“字面量/字面值”
select abc from emp;//这样肯定报错,因为会把abc当作一个字段的名字,去emp表中找abc字段去了
select 1000 as num from emp;//1000也是被当作一个字面量/字面值。
8.3 结论:select后面可以跟某个表的字段名(可以等同看作变量名),也可以跟字面量/字面值(数据)。
8.4 round
8.5 select round(1236.567,0) as result from emp;//保留0位小数
select round(1236.567,1) as result from emp;//保留1位小数
select round(1236.567,-1) as result from emp;//保留-1位小数,结果为:1240
select round(1236.567,-2) as result from emp;//保留-2位小数,结果为:1200;
9. 生成随机数:rand()
9.1 select round(rand()*100,0) from emp;//100以内的随机数
10. 空处理函数:ifnull
10.1 在所有数据库当中,只要有null参与的数学运算,最终结果就是null。为了避免这个现象,需要使用ifnull函数。
ifnull函数的用法:ifnull(数据,被当作哪个值)//如果‘数据’为null的时候,把这个数据当作哪个值。
10.2 select ename,sal + comm as salcomm from emp;//带null
10.3 select ename,(sal+comm)*12 as yearsal from emp;//计算每个员工的年薪,依旧有null
10.4 select ename,(sal+ifnull(comm,0))*12 as yearsal from emp;
11. case..when..then..when..then..elas..end
11.1 当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其他正常.
(注意:不修改数据库,只是将查询结果显示为工资上调)
11.2 select ename,job,sal from emp;
select
ename,
job,
sal as oldsal,
(case job when 'MANAGER' then sal*1.1 when 'SALESMAN' then sal*1.5 else sal end) as newsal
from
emp;
分组函数(多行处理函数)
- 多行处理函数的特点:输入多行,最终输出一行。
- 注意:分组函数在使用的时候必须先进行分组,然后才能用。
如果没有对数据进行分组,整张表默认为一组。 - 多行处理函数:
- count:计数
- sum:求和
- avg:平均值
- max:最大值
- min:最小值
1. 最高工资:max
select max(sal) from emp;
2. 最低工资:min
select min(sal) from emp;
3. 工资和:sum
select sum(sal) from emp;
4. 平均工资:avg
select avg(sal) from emp;
5. 统计数量:count
select count(ename) from emp;
- 分组函数自动忽略null,你不需要提前对null进行处理。
- 分组函数中count(*)和count(具体字段)的区别?
- count(具体字段):表示统计该字段下所有不为null的元素的总数。
- count(*):统计表当中的总行数。
(每一行记录不可能都为null,一行数据中有一列不为null,则这行数据就是有效的)
- 分组函数不能直接使用在where子句中
- select ename,sal from emp where sal > min(sal);//报错的方法
- 所有的分组函数可以组合起来一起用。
- select sum(sal),min(sal),max(sal),avg(sal),count(sal) from emp;
分组查询
- 什么是分组查询?
- 在实际的应用中,可能有这种需求,需要先进行分组,然后对每一组的数据进行操作。这个时候我们需要使用分组查询,怎么进行分组查询呢?
1. 将之前的关键字全部组合在一起,来看看他们的执行顺序?
select
...
from
...
where
...
group by//分组
...
order by//排序
...
2. 以上关键字的顺序不能颠倒,需要记忆.
2.1 执行顺序.
1. from
2. where
3. group by
4. select
5. order by
3. 为什么分组函数不能直接使用在where后面?
3.1 select ename,sal from emp where sal > min(sal);//报错
</br>
3.2 因为分组函数在使用的时候必须先分组之后才能使用。
where执行的时候,还没有分组,所以where后面不能出现分组函数.
3.3 select sum(sal) from emp;
这个没有分组,为啥sum()函数可以用呢?
因为select在group by之后执行。
- ※重点结论※:
- 在一条select语句当中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数。
- 使用having可以对分完组之后的数据进一步过滤。
- having不能单独使用,having不能代替where,having必须和group by联合使用。
- 优化策略:where和having,优先选择where,where实在完成不了了,在选择having。
小总结
- 单表查询到这里就学完了
1. ※再次强调※
select ...
from ...
where ...
group by ...
having ...
order by ...
以上关键字只能按照这个顺序来,不能颠倒.
2. 执行顺序:
1. from
2. where
3. group by
4. having
5. select
6. order by
3. 从某张表中查询数据,经过where条件筛选出有价值的数据,对这些有价值的数据进行分组,分组之后可以使用having继续筛选,select查询出来,最后排序输出.
4.例:
找出每个岗位的平均薪资,要求显示平均薪资大于1500的,除MANAGER岗位之外,要求按照平均薪资降序排.
select
job,avg(sal) as avgsal
from
emp
where
job <> 'MANAGER'
group by
job
having
avg(sal) > 1500
order by
avgsal desc;
第二天
把查询结果去除重复记录:distinct
- 原表数据不会被修改,只是查询结果去重。
- 去重需要使用一个关键字:distinct
- distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。
1. select distinct job,deptno from emp;
2. select count(distinct job) from emp;
※连接查询※
什么是连接查询?
- 从一张表中单独查询,称为单表查询。
- emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。这种跨表查询,多张表联合起来查询数据,被称为连接查询。
连接查询的分类?
- 根据语法的年代分类:
- sql92:1992年时候出现的语法
- sql99:1999年时候出现的语法
- (这里重点学习sql99)
- 根据表连接的方式分类:
- 内连接:
- 等值连接
- 非等值连接
- 自连接
- 外连接:
- 左外连接(左连接)
- 右外连接(右连接)
- 全连接:(用的少,这里不做介绍)
- 内连接:
笛卡尔积现象
当两张表进行连接查询时,没有任何条件的限制会发生什么现象?
案例:查询每个员工所在部门名称?
两张表连接没有任何条件限制:
select ename,dname from emp,dept;
当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数是两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,一个数学现象)
如何避免笛卡尔积现象?
- 连接时加条件,满足这个条件的记录被筛选出来!
select ename,dname
from emp,dept
where emp.deptno = dept.deptno;
优化(起别名,效率问题 sql92语法)
select e.ename,d.dname
from emp e,dept d
where e.deptno = d.deptno
- 思考:最终查询的结果条数是14条,但是匹配的过程中,匹配的次数减少了吗?
- 并没有,还是56次,只不过进行了四选一,次数没有减少。
- 注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的连接次数。
内连接
- 特点:完全能够匹配上这个条件的数据查询出来。
- a,b两张表没有主次关系,平等的。
内连接——等值连接
案例: 查询每个员工所在部门名称,显示员工名和部门名?
SQL92语法:
select e.ename,d.dname
from emp e,dept d
where e.deptno = d.deptno;
SQL92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
SQL99语法:
select e.ename,d.dname
from emp e
inner join dept d
on e.deptno = d.deptno;//条件是等量关系,所以被称为等值连接。
//inner 可以省略
SQL99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后添加where条件。
SQL99语法:
select ...
from a
join b
on a和b的连接条件
where 筛选条件
内连接——非等值连接
案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?
select e.ename,e.sal,s.grade
from emp e
join salgrade s
on e.sal between s.losal and s.hisal;//条件不是一个等量关系,称为非等值连接。
内连接——自连接
案例:查询员工的上级领导,要求显示员工名和对应的领导名?
技巧:一张表看作两张表
select a.ename,b.ename
from emp a
join emp b
on a.mgr = b.empno;
外连接
- 任何一个右连接都有左连接的写法。
- 任何一个左连接都有右连接的写法。
- outer是可以省略的,带着可读性强。outer在join前边。
- 思考:外连接的查询结果条数一定是>=内连接的查询结果条数? (√)
右外连接(right,右连接)
- right:表示将join关键字右边的这张表看作主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。
- 在外链接当中,两张表连接,产生主次关系。
select e.ename,d.dname
from emp e
right outer join dept d
on e.deptno = d.deptno
左外连接(left,左连接)
- left:表示将join关键字左边的这张表看作主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询右边的表。
- 在外链接当中,两张表连接,产生主次关系。
select e.ename,d.dname
from emp e
left join dept d
on e.deptno = d.deptno
案例
- 外连接没有查询到该人的领导,会显示null
问题:查询每个员工的上级领导,要求显示所有员工的名字和领导名。
select a.ename '员工名',b.ename '领导名'
from emp a
left join emp b
on a.mgr = b.empno;
多表连接(三张、四张)
语法:
select ...
from a
join b
on a和b的连接条件
join c
on a和c的连接条件
right join d
on a和d的连接条件
一条sql中内连和外连可以混合,都可以出现!
案例:
找出每个员工的部门名称以及工资等级,
要求显示员工名、部门名、薪资、薪资等级?
select
e.ename,e.sal,d.dname,s.grade
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal betten s.losal and s.hisal;
升级案例:
找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级?
select e.ename,e.sal,d.dname,s.grade
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal between s.losal and s.hisal
left join
emp l
on
e.mgr = l.empno;
子查询
什么是子查询?
- select语句中嵌套select语句,被嵌套的select语句被称为子查询。
子查询都可以出现在哪里呢?
select
..(select)..
from
..(select)..
where
..(select)..
where子句中嵌套子查询
- 复习:where子句中不能直接使用分组函数。
案例:找出最低工资高的员工姓名和工资?
第一步:查询最低工资是多少
select min(sal) from emp;
第二步:找出>800的
select ename,sal from emp where sal > 800;
第三步:合并
select ename,sal from emp where sal > (select min(sal) from emp);
from子句中的子查询
注意:from后面的子查询,可以将子查询的查询结果当作一张临时表。
案例:找出每个岗位的平均工资的薪资等级。
第一步:找出每个岗位的平均工资(按照岗位分组求平均值)
select job,avg(sal) from emp group by job;
第二步:找出薪资等级表
select * from salgrade;
第三步:连接
select
t.*,s.grade
from
(sleect job,avg(sal) as avgsal from emp group by job) t
join
salgrade s
on
t.avgsal between s.losal and s.hisal;
select后面出现的子查询(了解)
案例:找出每个员工的部门名称,要求显示员工名,部门名
select e.ename,e.deptno, (select d.dname from dept d where e.deptno = d.deptno)as dname
from emp e
注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果,多余1条,就报错了!
union合并查询结果集
案例:查询工作岗位是MANAGER和SALESMAN的员工
select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';
select ename,job from emp where job in('MANAGER','SALESMAN');
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
union的效率要高一些,对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍得翻
而union可以减少匹配的次数,在减少匹配次数的情况下,还可以完成两个结果集的拼接。
a 连接 b 连接 c
a 10条记录
b 10条记录
c 10条记录
匹配次数是:1000次
a连接b一个结果:10*10 --> 100次
a连接c一个结果:10*10 --> 100次
使用union的话是:100次+100次 = 200次。(union把乘法变成了加法运算)
union在使用的时候有什么注意事项?
//错误的写法:union在进行结果集合并的时候,要求两个结果集的列数相同。
select ename,job from emp where job = 'MANAGER'
union
select ename from emp where job ='SALESMAN';
//MYSQL可以,oracle语法严格,不可以,报错。要求:结果集合并时列和列的数据类型也相同。
select ename,job from emp where job = 'MANAGER'
union
select ename,sal from emp where job = 'SALESMAN';
limit
- limit是将查询结果集的一部分取出来,通常使用在分页查询当中。
limit用法
- 完整用发:limit startIndex,length
- startIndex是起始下标,length是长度。
- 起始下标从0开始。
- 缺省用法:limit 5;这是取前五。
- 注意:mysql当中limit在order by之后执行
例:按照薪资降序,取出排名在前5名的员工
select
ename,sal
from
emp
order by
sal desc
limit 5;//取前五
select
ename,sal
from
emp
order by
sal desc
limit 0,5;//取前五
例:取出工资排名在3-5名的员工
select ename,sal
from emp
order by sal desc
limit 2,3;
2表示起始位置从下标2开始,就是第三条记录。
3表示长度
分页
每页显示3条记录
第一页:limit 0,3 [0 1 2]
第二页:limit 3,3 [3 4 5]
第三页:limit 6,3 [6 7 8]
每页显示pageSize条记录
第pageNo页:limit(pageNo - 1)* pageSize,pageSize
例:
public static void main(String[] args){
//用户提交过来一个页码,以及每页显示的记录条数
int pageNo = 5;//第五页
int pageSize = 10;//每页显示10条
int startIndex = (pageNo-1)*pageSize;
String sql = "select ...limit" + startIndex + "," + pageSize;
}
记公式:
limit(pageNo-1)*pageSize,pageSize
DQL语句大总结:
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
执行顺序:
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit
第三天
表的创建(建表)
建表的语法格式:(建表属于DDL语句,DDL包括:creat drop alter)
creat table 表名(字段名1 数据类型,字段名2 数据类型,字段名3 数据类型)
creat table 表名(
字段名1 数据类型,
字段名2 数据类型,
字段名3 数据类型
);
表名:建议以t_或者tbl_开始,可读性强。见名知意
字段名:见明知意
表名和字段名都属于标识符
关于Mysql中的数据类型?
有很多数据类型, 我们只要掌握一些常见的数据类型即可。
varchar(最长255)
可变长度的字符串
比较智能,节省空间。
会根据实际数据长度动态分配空间。
优点:节省空间
缺点:需要动态分配空间,速度慢
char(最长255)
定长字符串
不管实际的数据长度是多少。
分配固定长度的空间去存储数据。
使用不恰当的时候,可能会导致空间的浪费。
优点:不需要动态分配空间,速度快。
缺点:使用不当可能会导致空间的浪费。
varchar和char我们该如何选择?
例:
性别字段你选什么?因为性别是固定长度的字符串,所以选择char
姓名字段你选什么?每个人的名字长度不同,所以选择varchar。
根据实际情况进行选择
int(最长11)
数字中的整数型,等同于java的int。
bigint
数字中的长整型。等同于java的long。
float
单精度浮点型数据
double
双精度浮点型数据
date
短日期类型
datetime
长日期类型
clob
字符大对象
最多可以存储4G的字符串
比如:存储一篇文章,存储一个说明。
超过255个字符的都要采用CLOB字符大对象来存储。
Character Large OBject:CLOB
blob
二进制大对象
Binary Large OBject
专门用来存储图片、声音、视频等流媒体数据。
往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等。
需要使用IO流才行。
例
t_movie 电影表(专门存储电影信息的)
编号 名字 描述信息 上映日期 时长
no(bigint) name(valchar)
| 编号 | 名字 | 故事情节 | 上映日期 | 时长 | 海报 | 类型 |
| no(bigint) | name(varchar) | history(clob) | playtime(date) | time(double) | image(blob) | type(char) |
| 1000 | 精忠报国 | ....... | 2019-10-11 | 2.5 | ... | 1 |
| 1001 | 三国演义 | ....... | 2012-12-11 | 1.5 | ... | 2 |
创建一个学生表
学号、姓名、年龄、性别、邮箱地址
create table t_student(
no int,
name varchar(32),
sex char(1),
age int(3),
email varchar(255)
);
删除表
drop table t_student;//当这张表不存在的时候删除会报错
drop table if exists t_student;//如果这张表存在的话删除,不会报错
插入数据insert(DML)
语法格式:
insert into 表名(字段名1,字段名2,字段名3...) values(值1,值2,值3);
注意:字段名和值要一一对应。什么是一一对应?
数量要对应,数据类型要对应。
insert into t_student(no,name,sex,age,email)values(1,'张三','m',20,'zhangsan@123.com');
insert into t_student(email,name,sex,age,no)values('zhangsan@123.com','李四','f',20,2);
insert into t_student(no) values(3);
insert into t_student(name) values('wangwu');
注意:insert语句只要执行成功,那么必然会多一条记录。
没有给其他字段指定值的话,默认值是null。
drop table if exists t_student;
creat table t_student(
no int,
name varchar(32),
sex char(1) default 'm',
age int(3),
email varchar(255)
);
//default:默认值。
insert语句中的字段名可以省略吗?可以
insert into t_student values(2);//错误的
insert into t_sutdent values(2,'lisi','f',20,'lisi@123.com');//正确的
注意:如果省略,要把参数都写上
insert插入日期
数字格式化:format
select ename,sal from emp;
格式化数字:format(数字,'格式');
select ename,format(sal,'$999.999') as sal from emp;
字符串转换为日期:str_to_date
将字符串varchar类型转换成date类型
日期转换为字符串:date_format
将date类型转换成具有一定格式的varchar类型
drop table if exists t_user;
creat table t_user(
id int,
name varchar(32),
birth date/birth char(10)//二选一
);
注意:数据库中有一条命名规范
所有的标识符都是全部小写,单词和单词之间是用下划线进行衔接。
插入数据
insert into t_user(id,name,birth) values(1,'zhangsan','01-10-1990');
//如果数据库中日期是date类型,这里使用varcahr类型(也就是‘这里写的内容’),会报错,原因是类型不匹配,数据库birth是date类型,这里给了一个字符串
如何解决?
可以使用str_to_date函数进行类型转换。
str_to_date函数可以将字符串转换成日期类型date
语法格式
str_to_date('字符串日期','日期格式')
Mysql日期格式
%Y 年
%m 月
%d 日
%h 时
%i 分
%s 秒
insert into t_user(id,name,birth)values(1,'zhangsan',str_to_date('01-10-1990','%d-%m-%Y'));
str_to_date函数可以把字符串varchar转换成日期date类型数据,通常使用在插入insert方面,因为插入的时候需要一个日期类型的数据,需要通过该函数将字符串转换成date。
注意:如果你date中写的日期字符串是%Y-%m-%d这个格式,就不需要使用str_to_date了
insert into t_user(id,name,birth)values(2,'lisi','1990-10-01');
查询的时候可以以某个特定的日期格式展示吗?
date_format
这个函数可以将日期类型转换成特定格式的字符串
select id,name,date_format(birth,'%m/%d/%Y') as birth from t_user;
date_format函数怎么用?
date_format(日期类型数据,'日期格式')
这个函数通常使用在查询日期方面,设置展示的日期格式。
select id,name,birth from t_user;
以上的sql语句实际上是进行了默认的日期格式化,
自动将数据库中的date类型转换成varchar类型。
并且采用的格式是mysql默认的日期格式:'%Y-%m-%d'
回顾:Java中的日期格式是怎么样的?
YYYY-MM-dd HH:mm:ss
date和datetime两个类型的区别?
date是短日期:只包括年月日信息
datetime是长期日:包括年月日时分秒信息
drop table if exists t_suer;
create table t_user(
id int,
name varchar(32),
birth date,
create_time datetime
);
id是整数
name是字符串
birth是短期日
create_time是这条记录的创建时间:长日期类型
mysql短期日默认格式:%Y-%m-%d
mysql长期日默认格式:%Y-%m-%d %h:%i:%s
insert into t_user(id,name,birth,create_time)values(1,'zhangsan','1990-10-01','2020-03-18 15:49:50');
在mysql当中怎么获取系统当前时间?
now() 函数,并且获取的时间带有时分秒信息,是datetime类型的。
insert into t_user(id,name,birth,create_time)values(2,'lisi','1990-10-01',now());
修改update(DML)
语法格式:
update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3... where 条件;
update t_user set name = 'jack',birth = '2000-10-11',create_time = now() where id=2;
注意:没有条件限制会导致所有数据全部更新。
例:update t_user set name = 'abc';//会导致所有name属性都改成abc
删除数据 delete(DML)
delete from t_user where id =2;
注意:没有条件限制会导致全部数据删除。
delete from t_user;//删除所有
insert into t_user(id) values(2);//插入一条记录
一次插入多条记录
insert into t_user(字段名1,字段名2)values(),(),(),();
快速建表(了解)
- create table emp2 as select * from emp;
- create table mytable as select empno,ename from emp where job = ‘MANAGER’;
- 原理:
- 将一个查询结果当作一张表新建
- 这个可以完成表的快速复制
- 表创建出来,同时表中的数据也存在了
将查询结果插入到一张表当中
create table dept_bak as select * from dept;//查询dept_bak并创建一张相同的表名为dept
select * from dept_bak;//查询dept_bak这张表
insert into dept_bak select * from dept;//查询的dept表并插入到dept_bak当中
快速删除表中的数据[truncate比较重要,必须掌握]
//删除dept_bak表中的数据
delete from dept_bak;//这种删除数据的方式比较慢
delete语句删除数据的原理:(delete数据DML语句)
1. 表中的数据被删除了,但是这个数据在硬盘上真是存储空间不会被释放
2. 这种删除的缺点是:删除效率比较低
3. 这种删除的优点是:支持回滚,后悔了可以在恢复数据
truncate语句删除数据的原理:
1. 这种删除效率比较高,表被一次截断,物理删除
2. 这种删除的缺点是:不支持回滚
3. 这种删除的优点是:快速
用法:truncate table dept_bak;(这种操作属于DDL操作)
注:使用truncate之前必须仔细询问客户是否真的要删除,并警告删除之后不可恢复。
truncate是删除表中的数据,表还在
删除表操作:
drop table 表名;//这不是删除表中的数据,是把表删除
对表结构增删改?
- 对于表结构的修改:添加一个字段,删除一个字段,修改一个字段
- 对表结构的修改需要使用:alter,属于DDL语句
- DDL包括:create drop alter
- 第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。修改表的结构,对应的java代码就需要进行大量的修改,成本比较高,这个责任应该由设计人员来承担
- 第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天真的要修改表结构,可以使用工具
- 修改表结构的操作时不需要写到java程序中的,实际上也不是java程序员的范畴。
约束
什么是约束?
- 约束对应的英语单词:constraint
- 在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的完整性、有效性。
- 约束的作用就是为了保证:表中的数据有效
约束包括那些?
- 非空约束:not null
- 唯一性约束:unique
- 主键约束:primary key (简称PK)
- 外键约束:foreign key (简称FK)
- 检查约束:check(mysql不支持,oracle支持)
- 我们在这里重点学习四个约束:
- 非空约束(not null),唯一性约束(unique)。主键约束(primary key),外键约束(foreign key)。
非空约束(not null)
- 非空约束not null约束的字段不能为null
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null//not null只有列级约束,没有表级约束
);
insert into t_vip(id,name)values(1,'zhangsan');
insert into t_vip(id,name)values(2,'lisi');
insert into t_vip(id)values(3);//name 不能为空,会报错
小插曲:
xxxx.sql这种文件被称为sql脚本文件。
sql脚本文件中编写了大量的sql语句
我们执行sql脚本文件的时候,该文件中所有的sql语句会全部执行
批量的执行sql语句,可以使用sql脚本文件
在mysql中怎么执行sql脚本呢?
用命令的方式:source 路径
你在实际的工作中,第一天到了公司,项目经理就会给你一个xxx.sql文件,你执行这个脚本文件,你电脑上的数据库数据就有了
唯一性约束:unique
- 唯一性约束unique约束的字段不能重复,但是可以为null
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique,
email varchar(255)
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com');
t_vip(id,name,email)values(2,'lisi','lisi@123.com');
t_vip(id,name,email)values(3,'wangwu','wangwu@123.com');
select * from t_vip;
insert into t_vip(id,name,email)values(4,'wangwu','wangwu@sina.com');//这时候再擦汇入这条数据,因为name的唯一性,所以报错
insert into t_vip(id) values(4);
insert into t_vip(id) values(5);
name字段虽然被unique约束了,但是可以为null。
新需求:name和email两个字段联合起来具有唯一性
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique,//约束直接添加到列后面,叫做列级约束。
email varchar(255) unique
);
这张表这样创建是不符合以上的‘新需求’的
这样创建表示:name具有唯一性,email具有唯一性,各自唯一。
以下这样的数据符合‘新需求’
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com')
insert into t_vip(id,name,email)values(2,'zhangsan','zhangsan@sina.com')
怎么创建这样的表,才能符合新需求呢?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
email varchar(255),
unique(name,email)//约束没有添加在列后面,这种约束被称为表级约束。
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com')
insert into t_vip(id,name,email)values(2,'zhangsan','zhangsan@sina.com')
select * from t_vip;
name和email两个字段联合起来唯一
insert into t_vip(id,name,email)values(3,'zhangsan','zhangsan@sina.com')//这时候在添加该条记录将会报错
什么时候使用表级约束呢?
需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束。
unique和not null可以联合吗?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null unique
);
desc t_vip;//这时候,我们再看表结构,拥有not null和unique两个约束的字段key中会显示主键
在mysql当中,如果一个字段同时被not null和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样!)
insert into t_vip(id,name)values(1,'zhangsan');
insert into t_vip(id,name)values(2,'zhangsan');//错误了,name不能重复
insert into t_vip(id)values(2);//错误了,name不能为null
主键约束(primary key,简称PK)
主键约束的相关术语
- 主键约束:一种约束
- 主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段
- 主键值:主键字段中每一个值都叫做:主键值
什么是主键?有什么用?
- 主键值是每一行记录的唯一标识
- 主键值是每一行记录的身份证号
- 任何一张表都应该有主键,没有主键,表无效
- 主键特征:not null + unique (主键值不能是null,同时也不能重复)
如何给一张表添加主键约束?
drop table if exists t_vip;
create table t_vip(
id int primary key,//列级约束
name varchar(255)
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
//错误:主键不能重复
insert into t_vip(id,name) values(2,'wangwu');
//错误:主键不能为NULL
insert into t_vip(name) values('zhaoliu');
可以使用表级约束添加主键吗?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
primary key(id)//表级约束
);
答案:可以
表级约束主要是给多个字段联合起来添加约束?
drop table if exists t_vip;
//id和name联合起来做主键:复合主键
create table t_vip(
id int,
name varchar(255),
email varchar(255),
primary key(id,name)
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com');
insert into t_vip(id,name,email)values(1,'lisi','lisi@123.com');
第一天
1. 什么是数据库?什么是数据库管理系统?什么是sql?它们之间的关系是什么?
数据库:
英文单词DataBase,简称DB。按照一定格式存储数据的一些文件的组合。
顾名思义:存储数据的仓库,实际上就是一堆文件。这些文件中存储了具有特定格式的数据。
数据库管理系统:
DataBaseManagement,简称DBMS
数据库管理系统是专门用来管理数据库中的数据,数据库管理系统可以对数据库当中的数据进行增删改查。
常见的数据库管理系统:
Mysql、Oracle、MS SqlServer、DB2、sybase等.....
SQL:结构化查询语言
程序员需要学习SQL语句,程序员通过编写SQL语句,然后DBMS负责执行SQL语句,最终来完成数据库中数据的增删改查操作.
SQL是一套标准,程序员主要学习的就是SQL语句,这个SQL在mysql中可以使用,同时在Oracle中也可以使用,在DB2中也可以使用。
三者之间的关系?
DBMS--执行-->SQL--操作-->DB
先安装数据库管理系统MySQL,然后学习SQL语句怎么写,编写SQL语句之后,DBMS对SQL语句进行执行,最终来完成数据库的数据管理。
2. 安装MySQL数据库管理系统
注意事项:
端口号:
端口号port是任何一个软件/应用都会有的,端口号是应用的唯一代表。端口号通常和ip地址在一块,ip地址用来定位计算机的,端口号port是用来定位计算机上某个服务/某个应用的!
在同一台计算机上,端口号不能重复,具有唯一性。
Mysql数据库启动的时候,这个服务占有的默认端口号是3306。
字符编码方式:
设置mysql数据库的字符编码方式为utf8
服务名称:
默认是Mysql,不需要改。
选择配置环境变量path,也可以手动配置。
设置密码的同时,可以激活root账户远程访问。
激活:表示root账号可以在外地登录。
不激活:表示root账号只能在本机上使用。
Mysql数据库的完美卸载
双击安装包进行删除。
删除目录,在C盘下的Program(X86)的Mysql文件夹,以及ProgramData下的Mysql目录删除。
Mysql的服务
启动,暂停,自动,默认配置。
在windows操作系统中,怎么用命令来启动和关闭mysql服务?
net stop 服务名称(MySQL)(停止服务)
net start 服务名称(MySQL)(开启服务)
其他服务启停都可以采用以上命令。
登录
(显示密码形式)
cmd命令行中输入命令:mysql -uroot -p123456
(隐藏密码形式)
cmd命令行中输入命令:mysql -uroot -p
常用命令(不区分大小写)
退出mysql:exit
查看mysql中有哪些数据库:show databases;
(mysql默认自带四个数据库)
选择使用某个数据库:use 数据库名;
创建数据库:create database 数据库名;
查看某个数据库下有哪些表:show tables;
不看表数据,只看表结构:desc 表名;
varchar就是Java中的String
不见分号不执行。
终止:\c
查看Mysql数据库版本号:select version();
查看当前用的数据库:select database;
什么是表table?为什么用表来存储数据呢?
数据库当中最基本的单元是表:table
数据库当中是以表格的形式表示数据的。因为表比较直观。
任何一张表都有行和列, 行(row):被称为数据/记录。 列(column):被称为字段。
每个字段都有:字段名、数据类型、约束等属性。
数据类型:字符串、数字、日期。。。。
约束:约束有很多,其中一个叫唯一性约束,这种约束添加之后,该字段中的数据不能重复。
关于SQL语句的分类?
sql语句有很多,最好进行分门别类,这样容易记忆。
DQL:数据查询语言(凡是带有select关键字的都是查询语句)select...
DML:数据操作语言(凡是对表当中的数据进行增删改的都是DML)insert增 delete删 update改
DDL:数据定义语言(凡是带有create、drop、alter的都是DDL)DDL主要操作的是表的结构,不是表中的数据。 create:新建,等同于增 drop:删除 alter:修改 这个增删改和DML不同,这个主要是对表结构进行操作。
TCL:是事务控制语言, 包括事务提交:commit; 事务回滚:rollback;
DCL:数据控制语言; 例如:授权grant、撤销权限revoke......
数据导入
(导入数据)输入命令方式:source 路径(路径中不能有中文)
dept是部门表
emp是员工表
salgrade是工资等级表
怎么查看表中的数据?
select * from 表名;
简单查询
查询一个字段 select 字段名 from 表名;
其中要注意:
select和from都是关键字。
字段名和表名都是标识符。
强调:sql语句不区分大小写。
查询两个字段,或者多个字段 :用逗号隔开。
查询所有字段,可以把每个字段都写上,或者使用*号
给查询列起别名
可以用as关键字
SELECT DEPTNO,DNAME AS DEPTNAME FROM DEPT;
可以使用空格代替
可以添加单/双引号括起来
注意:在所有的数据库当中,字符串统一使用单引号括起来,单引号是标准,双引号在oracle数据库中用不了,但是在Mysql中可以使用。
别名是中文,用单引号括起来。
条件查询
select 字段1,字段2,字段3。。。。
from 表名
where 条件;
使用between...and...遵循左小右大
between...and...闭区间
is null 为 null(is not null 不为空)
在数据库当中null不能使用等号进行衡量。要使用is null,因为数据库中的null代表什么也没有,他不是一个值,所以不能使用等号衡量。
and并且
or或者
and和or同时出现,and优先级较高。如过想让or先执行,需要加小括号,如果不确定优先级,就加小括号。
in包含,相当于多个和or(not in 不在这个范围中)
注意:in不是一个区间,in后面跟的是具体的值。
not 可以取非,主要用在is或in中
like 称谓模糊查询,支持%或者下划线匹配
%:匹配任意多个字符
下划线:任意一个字符
找出名字带有下划线的,因为下划线代表特定内容,所以要加上斜杠 \,进行转义。
排序
order by(默认升序)
desc是降序,指定按照什么进行排序,比如:工资 desc;
asc是升序,同上。
多个字段排序
例:查询员工名字和薪资,要求按照薪资升序,如果薪资一样,再按照名字升序排列。
select ename,sal
from emp
order by sal asc,ename asc;
//sal在前,起主导,只有sal相等的时候,才会考虑启用ename排序
了解:根据字段位置进行排序
select ename,sal
from emp
order by 2;
//2表示第二列,第二列目前是sal,按照查询结果的第二列sal排序。
//了解一下即可,不建议在开发中这样写,因为不健壮。
</br>
//列的顺序很容易发生改变,列顺序改变之后,2就费了
格式
select
...
from
...
where
...
order by
...;
第一步:from
第二步:where
第三步:select
第四步:order by(排序总在最后执行!)
数据处理函数(单行处理函数)
数据处理函数又被称为单行处理函数
单行处理函数的特点:一个输入对应一个输出。
和单行处理函数相对的是:多行处理函数。 (多行处理函数特点:多个输入,对应1个输出!)
多少个输入,最后就是多少个输出,这是单行处理函数的特点。
单行处理函数常见的有哪些
lower:转小写
upper:转大写
substr(被截取的字符串,起始下标,截取的长度):取子串(起始下标从1开始)
concat:函数进行字符串的拼接
length:取长度
trim:去空格
round:四舍五入
rand:生成随机数
ifnull:空处理函数,专门用于处理空的。(可以将null转换成一个具体值)
case..when..then..when..then..else..end
str_to_date:将字符串转换成日期
date_format:格式化日期
format:设置千分位
例:
1. 转小写:lower
select lower(ename) as ename from emp;
2. 转大写:upper
select upper(ename) as ename from emp;
3. 取子串:substr
找出员工名字第一个字母是A的员工信息?
3.1 第一种方式(模糊查询):
select ename
from emp
where ename like 'A%';
3.2 第二种方式(substr函数):
select ename
from emp
where substr(ename,1,1) = 'A';
4. 首字母大写?
4.1. select name from t_student;
4.2. select upper(substr(name,1,1)) form t_student;
4.3. select substr(name,2,length(name)-1) from t_student;
4.4. select concat(upper(substr(name,1,1)),substr(name,2,length(name)-1)) as result from t_student;
5. 字符串拼接:concat
select concat(empno,ename) from emp'
6. 取长度:length
select length(ename) enamelength from emp;
7. 去空格:trim
7.1 select *
from emp
where ename = ' KING';
7.2 select *
from emp
where ename = trim(' KING');
8. 四舍五入:round
8.1 select 字段 from 表名;
select ename from emp;
8.2 select 'abc' from emp;//select后面直接跟“字面量/字面值”
select abc from emp;//这样肯定报错,因为会把abc当作一个字段的名字,去emp表中找abc字段去了
select 1000 as num from emp;//1000也是被当作一个字面量/字面值。
8.3 结论:select后面可以跟某个表的字段名(可以等同看作变量名),也可以跟字面量/字面值(数据)。
8.4 round
8.5 select round(1236.567,0) as result from emp;//保留0位小数
select round(1236.567,1) as result from emp;//保留1位小数
select round(1236.567,-1) as result from emp;//保留-1位小数,结果为:1240
select round(1236.567,-2) as result from emp;//保留-2位小数,结果为:1200;
9. 生成随机数:rand()
9.1 select round(rand()*100,0) from emp;//100以内的随机数
10. 空处理函数:ifnull
10.1 在所有数据库当中,只要有null参与的数学运算,最终结果就是null。为了避免这个现象,需要使用ifnull函数。
ifnull函数的用法:ifnull(数据,被当作哪个值)//如果‘数据’为null的时候,把这个数据当作哪个值。
10.2 select ename,sal + comm as salcomm from emp;//带null
10.3 select ename,(sal+comm)*12 as yearsal from emp;//计算每个员工的年薪,依旧有null
10.4 select ename,(sal+ifnull(comm,0))*12 as yearsal from emp;
11. case..when..then..when..then..elas..end
11.1 当员工的工作岗位是MANAGER的时候,工资上调10%,当工作岗位是SALESMAN的时候,工资上调50%,其他正常.
(注意:不修改数据库,只是将查询结果显示为工资上调)
11.2 select ename,job,sal from emp;
select
ename,
job,
sal as oldsal,
(case job when 'MANAGER' then sal*1.1 when 'SALESMAN' then sal*1.5 else sal end) as newsal
from
emp;
分组函数(多行处理函数)
多行处理函数的特点:输入多行,最终输出一行。
注意:分组函数在使用的时候必须先进行分组,然后才能用。
如果没有对数据进行分组,整张表默认为一组。
多行处理函数:
count:计数
sum:求和
avg:平均值
max:最大值
min:最小值
1. 最高工资:max
select max(sal) from emp;
2. 最低工资:min
select min(sal) from emp;
3. 工资和:sum
select sum(sal) from emp;
4. 平均工资:avg
select avg(sal) from emp;
5. 统计数量:count
select count(ename) from emp;
分组函数自动忽略null,你不需要提前对null进行处理。
分组函数中count(*)和count(具体字段)的区别?
count(具体字段):表示统计该字段下所有不为null的元素的总数。
count(*):统计表当中的总行数。
(每一行记录不可能都为null,一行数据中有一列不为null,则这行数据就是有效的)
分组函数不能直接使用在where子句中
select ename,sal from emp where sal > min(sal);//报错的方法
所有的分组函数可以组合起来一起用。
select sum(sal),min(sal),max(sal),avg(sal),count(sal) from emp;
分组查询
什么是分组查询?
在实际的应用中,可能有这种需求,需要先进行分组,然后对每一组的数据进行操作。这个时候我们需要使用分组查询,怎么进行分组查询呢?
1. 将之前的关键字全部组合在一起,来看看他们的执行顺序?
select
...
from
...
where
...
group by//分组
...
order by//排序
...
2. 以上关键字的顺序不能颠倒,需要记忆.
2.1 执行顺序.
1. from
2. where
3. group by
4. select
5. order by
3. 为什么分组函数不能直接使用在where后面?
3.1 select ename,sal from emp where sal > min(sal);//报错
</br>
3.2 因为分组函数在使用的时候必须先分组之后才能使用。
where执行的时候,还没有分组,所以where后面不能出现分组函数.
3.3 select sum(sal) from emp;
这个没有分组,为啥sum()函数可以用呢?
因为select在group by之后执行。
※重点结论※:
在一条select语句当中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数。
使用having可以对分完组之后的数据进一步过滤。
having不能单独使用,having不能代替where,having必须和group by联合使用。
优化策略:where和having,优先选择where,where实在完成不了了,在选择having。
小总结
单表查询到这里就学完了
1. ※再次强调※
select ...
from ...
where ...
group by ...
having ...
order by ...
以上关键字只能按照这个顺序来,不能颠倒.
2. 执行顺序:
1. from
2. where
3. group by
4. having
5. select
6. order by
3. 从某张表中查询数据,经过where条件筛选出有价值的数据,对这些有价值的数据进行分组,分组之后可以使用having继续筛选,select查询出来,最后排序输出.
4.例:
找出每个岗位的平均薪资,要求显示平均薪资大于1500的,除MANAGER岗位之外,要求按照平均薪资降序排.
select
job,avg(sal) as avgsal
from
emp
where
job <> 'MANAGER'
group by
job
having
avg(sal) > 1500
order by
avgsal desc;
第二天
把查询结果去除重复记录:distinct
原表数据不会被修改,只是查询结果去重。
去重需要使用一个关键字:distinct
distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。
1. select distinct job,deptno from emp;
2. select count(distinct job) from emp;
※连接查询※
什么是连接查询?
从一张表中单独查询,称为单表查询。
emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。这种跨表查询,多张表联合起来查询数据,被称为连接查询。
连接查询的分类?
根据语法的年代分类:
sql92:1992年时候出现的语法
sql99:1999年时候出现的语法
(这里重点学习sql99)
根据表连接的方式分类:
内连接:
等值连接
非等值连接
自连接
外连接:
左外连接(左连接)
右外连接(右连接)
全连接:(用的少,这里不做介绍)
笛卡尔积现象
当两张表进行连接查询时,没有任何条件的限制会发生什么现象?
案例:查询每个员工所在部门名称?
两张表连接没有任何条件限制:
select ename,dname from emp,dept;
当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数是两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,一个数学现象)
如何避免笛卡尔积现象?
连接时加条件,满足这个条件的记录被筛选出来!
select ename,dname
from emp,dept
where emp.deptno = dept.deptno;
优化(起别名,效率问题 sql92语法)
select e.ename,d.dname
from emp e,dept d
where e.deptno = d.deptno
思考:最终查询的结果条数是14条,但是匹配的过程中,匹配的次数减少了吗?
并没有,还是56次,只不过进行了四选一,次数没有减少。
注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的连接次数。
内连接
特点:完全能够匹配上这个条件的数据查询出来。
a,b两张表没有主次关系,平等的。
内连接——等值连接
案例: 查询每个员工所在部门名称,显示员工名和部门名?
SQL92语法:
select e.ename,d.dname
from emp e,dept d
where e.deptno = d.deptno;
SQL92的缺点:结构不清晰,表的连接条件,和后期进一步筛选的条件,都放到了where后面。
SQL99语法:
select e.ename,d.dname
from emp e
inner join dept d
on e.deptno = d.deptno;//条件是等量关系,所以被称为等值连接。
//inner 可以省略
SQL99优点:表连接的条件是独立的,连接之后,如果还需要进一步筛选,再往后添加where条件。
SQL99语法:
select ...
from a
join b
on a和b的连接条件
where 筛选条件
内连接——非等值连接
案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?
select e.ename,e.sal,s.grade
from emp e
join salgrade s
on e.sal between s.losal and s.hisal;//条件不是一个等量关系,称为非等值连接。
内连接——自连接
案例:查询员工的上级领导,要求显示员工名和对应的领导名?
技巧:一张表看作两张表
select a.ename,b.ename
from emp a
join emp b
on a.mgr = b.empno;
外连接
任何一个右连接都有左连接的写法。
任何一个左连接都有右连接的写法。
outer是可以省略的,带着可读性强。outer在join前边。
思考:外连接的查询结果条数一定是>=内连接的查询结果条数? (√)
右外连接(right,右连接)
right:表示将join关键字右边的这张表看作主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。
在外链接当中,两张表连接,产生主次关系。
select e.ename,d.dname
from emp e
right outer join dept d
on e.deptno = d.deptno
左外连接(left,左连接)
left:表示将join关键字左边的这张表看作主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询右边的表。
在外链接当中,两张表连接,产生主次关系。
select e.ename,d.dname
from emp e
left join dept d
on e.deptno = d.deptno
案例
外连接没有查询到该人的领导,会显示null
问题:查询每个员工的上级领导,要求显示所有员工的名字和领导名。
select a.ename '员工名',b.ename '领导名'
from emp a
left join emp b
on a.mgr = b.empno;
多表连接(三张、四张)
语法:
select ...
from a
join b
on a和b的连接条件
join c
on a和c的连接条件
right join d
on a和d的连接条件
一条sql中内连和外连可以混合,都可以出现!
案例:
找出每个员工的部门名称以及工资等级,
要求显示员工名、部门名、薪资、薪资等级?
select
e.ename,e.sal,d.dname,s.grade
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal betten s.losal and s.hisal;
升级案例:
找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级?
select e.ename,e.sal,d.dname,s.grade
from
emp e
join
dept d
on
e.deptno = d.deptno
join
salgrade s
on
e.sal between s.losal and s.hisal
left join
emp l
on
e.mgr = l.empno;
子查询
什么是子查询?
select语句中嵌套select语句,被嵌套的select语句被称为子查询。
子查询都可以出现在哪里呢?
select
..(select)..
from
..(select)..
where
..(select)..
where子句中嵌套子查询
复习:where子句中不能直接使用分组函数。
案例:找出最低工资高的员工姓名和工资?
第一步:查询最低工资是多少
select min(sal) from emp;
第二步:找出>800的
select ename,sal from emp where sal > 800;
第三步:合并
select ename,sal from emp where sal > (select min(sal) from emp);
from子句中的子查询
注意:from后面的子查询,可以将子查询的查询结果当作一张临时表。
案例:找出每个岗位的平均工资的薪资等级。
第一步:找出每个岗位的平均工资(按照岗位分组求平均值)
select job,avg(sal) from emp group by job;
第二步:找出薪资等级表
select * from salgrade;
第三步:连接
select
t.*,s.grade
from
(sleect job,avg(sal) as avgsal from emp group by job) t
join
salgrade s
on
t.avgsal between s.losal and s.hisal;
select后面出现的子查询(了解)
案例:找出每个员工的部门名称,要求显示员工名,部门名
select e.ename,e.deptno, (select d.dname from dept d where e.deptno = d.deptno)as dname
from emp e
注意:对于select后面的子查询来说,这个子查询只能一次返回1条结果,多余1条,就报错了!
union合并查询结果集
案例:查询工作岗位是MANAGER和SALESMAN的员工
select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN';
select ename,job from emp where job in('MANAGER','SALESMAN');
select ename,job from emp where job = 'MANAGER'
union
select ename,job from emp where job = 'SALESMAN';
union的效率要高一些,对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍得翻
而union可以减少匹配的次数,在减少匹配次数的情况下,还可以完成两个结果集的拼接。
a 连接 b 连接 c
a 10条记录
b 10条记录
c 10条记录
匹配次数是:1000次
a连接b一个结果:10*10 --> 100次
a连接c一个结果:10*10 --> 100次
使用union的话是:100次+100次 = 200次。(union把乘法变成了加法运算)
union在使用的时候有什么注意事项?
//错误的写法:union在进行结果集合并的时候,要求两个结果集的列数相同。
select ename,job from emp where job = 'MANAGER'
union
select ename from emp where job ='SALESMAN';
//MYSQL可以,oracle语法严格,不可以,报错。要求:结果集合并时列和列的数据类型也相同。
select ename,job from emp where job = 'MANAGER'
union
select ename,sal from emp where job = 'SALESMAN';
limit
limit是将查询结果集的一部分取出来,通常使用在分页查询当中。
limit用法
完整用发:limit startIndex,length
startIndex是起始下标,length是长度。
起始下标从0开始。
缺省用法:limit 5;这是取前五。
注意:mysql当中limit在order by之后执行
例:按照薪资降序,取出排名在前5名的员工
select
ename,sal
from
emp
order by
sal desc
limit 5;//取前五
select
ename,sal
from
emp
order by
sal desc
limit 0,5;//取前五
例:取出工资排名在3-5名的员工
select ename,sal
from emp
order by sal desc
limit 2,3;
2表示起始位置从下标2开始,就是第三条记录。
3表示长度
分页
每页显示3条记录
第一页:limit 0,3 [0 1 2]
第二页:limit 3,3 [3 4 5]
第三页:limit 6,3 [6 7 8]
每页显示pageSize条记录
第pageNo页:limit(pageNo - 1)* pageSize,pageSize
例:
public static void main(String[] args){
//用户提交过来一个页码,以及每页显示的记录条数
int pageNo = 5;//第五页
int pageSize = 10;//每页显示10条
int startIndex = (pageNo-1)*pageSize;
String sql = "select ...limit" + startIndex + "," + pageSize;
}
记公式:
limit(pageNo-1)*pageSize,pageSize
DQL语句大总结:
select
...
from
...
where
...
group by
...
having
...
order by
...
limit
...
执行顺序:
1.from
2.where
3.group by
4.having
5.select
6.order by
7.limit
表的创建(建表)
建表的语法格式:(建表属于DDL语句,DDL包括:creat drop alter)
creat table 表名(字段名1 数据类型,字段名2 数据类型,字段名3 数据类型)
creat table 表名(
字段名1 数据类型,
字段名2 数据类型,
字段名3 数据类型
);
表名:建议以t_或者tbl_开始,可读性强。见名知意
字段名:见明知意
表名和字段名都属于标识符
关于Mysql中的数据类型?
有很多数据类型, 我们只要掌握一些常见的数据类型即可。
varchar(最长255)
可变长度的字符串
比较智能,节省空间。
会根据实际数据长度动态分配空间。
优点:节省空间
缺点:需要动态分配空间,速度慢
char(最长255)
定长字符串
不管实际的数据长度是多少。
分配固定长度的空间去存储数据。
使用不恰当的时候,可能会导致空间的浪费。
优点:不需要动态分配空间,速度快。
缺点:使用不当可能会导致空间的浪费。
varchar和char我们该如何选择?
例:
性别字段你选什么?因为性别是固定长度的字符串,所以选择char
姓名字段你选什么?每个人的名字长度不同,所以选择varchar。
根据实际情况进行选择
int(最长11)
数字中的整数型,等同于java的int。
bigint
数字中的长整型。等同于java的long。
float
单精度浮点型数据
double
双精度浮点型数据
date
短日期类型
datetime
长日期类型
clob
字符大对象
最多可以存储4G的字符串
比如:存储一篇文章,存储一个说明。
超过255个字符的都要采用CLOB字符大对象来存储。
Character Large OBject:CLOB
blob
二进制大对象
Binary Large OBject
专门用来存储图片、声音、视频等流媒体数据。
往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等。
需要使用IO流才行。
例
t_movie 电影表(专门存储电影信息的)
编号 名字 描述信息 上映日期 时长
no(bigint) name(valchar)
| 编号 | 名字 | 故事情节 | 上映日期 | 时长 | 海报 | 类型 |
| no(bigint) | name(varchar) | history(clob) | playtime(date) | time(double) | image(blob) | type(char) |
| 1000 | 精忠报国 | ....... | 2019-10-11 | 2.5 | ... | 1 |
| 1001 | 三国演义 | ....... | 2012-12-11 | 1.5 | ... | 2 |
创建一个学生表
学号、姓名、年龄、性别、邮箱地址
create table t_student(
no int,
name varchar(32),
sex char(1),
age int(3),
email varchar(255)
);
删除表
drop table t_student;//当这张表不存在的时候删除会报错
drop table if exists t_student;//如果这张表存在的话删除,不会报错
插入数据insert(DML)
语法格式:
insert into 表名(字段名1,字段名2,字段名3...) values(值1,值2,值3);
注意:字段名和值要一一对应。什么是一一对应?
数量要对应,数据类型要对应。
insert into t_student(no,name,sex,age,email)values(1,'张三','m',20,'zhangsan@123.com');
insert into t_student(email,name,sex,age,no)values('zhangsan@123.com','李四','f',20,2);
insert into t_student(no) values(3);
insert into t_student(name) values('wangwu');
注意:insert语句只要执行成功,那么必然会多一条记录。
没有给其他字段指定值的话,默认值是null。
drop table if exists t_student;
creat table t_student(
no int,
name varchar(32),
sex char(1) default 'm',
age int(3),
email varchar(255)
);
//default:默认值。
insert语句中的字段名可以省略吗?可以
insert into t_student values(2);//错误的
insert into t_sutdent values(2,'lisi','f',20,'lisi@123.com');//正确的
注意:如果省略,要把参数都写上
insert插入日期
数字格式化:format
select ename,sal from emp;
格式化数字:format(数字,'格式');
select ename,format(sal,'$999.999') as sal from emp;
字符串转换为日期:str_to_date
将字符串varchar类型转换成date类型
日期转换为字符串:date_format
将date类型转换成具有一定格式的varchar类型
drop table if exists t_user;
creat table t_user(
id int,
name varchar(32),
birth date/birth char(10)//二选一
);
注意:数据库中有一条命名规范
所有的标识符都是全部小写,单词和单词之间是用下划线进行衔接。
插入数据
insert into t_user(id,name,birth) values(1,'zhangsan','01-10-1990');
//如果数据库中日期是date类型,这里使用varcahr类型(也就是‘这里写的内容’),会报错,原因是类型不匹配,数据库birth是date类型,这里给了一个字符串
如何解决?
可以使用str_to_date函数进行类型转换。
str_to_date函数可以将字符串转换成日期类型date
语法格式
str_to_date('字符串日期','日期格式')
Mysql日期格式
%Y 年
%m 月
%d 日
%h 时
%i 分
%s 秒
insert into t_user(id,name,birth)values(1,'zhangsan',str_to_date('01-10-1990','%d-%m-%Y'));
str_to_date函数可以把字符串varchar转换成日期date类型数据,通常使用在插入insert方面,因为插入的时候需要一个日期类型的数据,需要通过该函数将字符串转换成date。
注意:如果你date中写的日期字符串是%Y-%m-%d这个格式,就不需要使用str_to_date了
insert into t_user(id,name,birth)values(2,'lisi','1990-10-01');
查询的时候可以以某个特定的日期格式展示吗?
date_format
这个函数可以将日期类型转换成特定格式的字符串
select id,name,date_format(birth,'%m/%d/%Y') as birth from t_user;
date_format函数怎么用?
date_format(日期类型数据,'日期格式')
这个函数通常使用在查询日期方面,设置展示的日期格式。
select id,name,birth from t_user;
以上的sql语句实际上是进行了默认的日期格式化,
自动将数据库中的date类型转换成varchar类型。
并且采用的格式是mysql默认的日期格式:'%Y-%m-%d'
回顾:Java中的日期格式是怎么样的?
YYYY-MM-dd HH:mm:ss
date和datetime两个类型的区别?
date是短日期:只包括年月日信息
datetime是长期日:包括年月日时分秒信息
drop table if exists t_suer;
create table t_user(
id int,
name varchar(32),
birth date,
create_time datetime
);
id是整数
name是字符串
birth是短期日
create_time是这条记录的创建时间:长日期类型
mysql短期日默认格式:%Y-%m-%d
mysql长期日默认格式:%Y-%m-%d %h:%i:%s
insert into t_user(id,name,birth,create_time)values(1,'zhangsan','1990-10-01','2020-03-18 15:49:50');
在mysql当中怎么获取系统当前时间?
now() 函数,并且获取的时间带有时分秒信息,是datetime类型的。
insert into t_user(id,name,birth,create_time)values(2,'lisi','1990-10-01',now());
修改update(DML)
语法格式:
update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3... where 条件;
update t_user set name = 'jack',birth = '2000-10-11',create_time = now() where id=2;
注意:没有条件限制会导致所有数据全部更新。
例:update t_user set name = 'abc';//会导致所有name属性都改成abc
删除数据 delete(DML)
delete from t_user where id =2;
注意:没有条件限制会导致全部数据删除。
delete from t_user;//删除所有
insert into t_user(id) values(2);//插入一条记录
一次插入多条记录
insert into t_user(字段名1,字段名2)values(),(),(),();
快速建表(了解)
create table emp2 as select * from emp;
create table mytable as select empno,ename from emp where job = 'MANAGER';
原理:
将一个查询结果当作一张表新建
这个可以完成表的快速复制
表创建出来,同时表中的数据也存在了
将查询结果插入到一张表当中
create table dept_bak as select * from dept;//查询dept_bak并创建一张相同的表名为dept
select * from dept_bak;//查询dept_bak这张表
insert into dept_bak select * from dept;//查询的dept表并插入到dept_bak当中
快速删除表中的数据[truncate比较重要,必须掌握]
//删除dept_bak表中的数据
delete from dept_bak;//这种删除数据的方式比较慢
delete语句删除数据的原理:(delete数据DML语句)
1. 表中的数据被删除了,但是这个数据在硬盘上真是存储空间不会被释放
2. 这种删除的缺点是:删除效率比较低
3. 这种删除的优点是:支持回滚,后悔了可以在恢复数据
truncate语句删除数据的原理:
1. 这种删除效率比较高,表被一次截断,物理删除
2. 这种删除的缺点是:不支持回滚
3. 这种删除的优点是:快速
用法:truncate table dept_bak;(这种操作属于DDL操作)
注:使用truncate之前必须仔细询问客户是否真的要删除,并警告删除之后不可恢复。
truncate是删除表中的数据,表还在
删除表操作:
drop table 表名;//这不是删除表中的数据,是把表删除
对表结构增删改?
对于表结构的修改:添加一个字段,删除一个字段,修改一个字段
对表结构的修改需要使用:alter,属于DDL语句
DDL包括:create drop alter
第一:在实际的开发中,需求一旦确定之后,表一旦设计好之后,很少的进行表结构的修改。因为开发进行中的时候,修改表结构,成本比较高。修改表的结构,对应的java代码就需要进行大量的修改,成本比较高,这个责任应该由设计人员来承担
第二:由于修改表结构的操作很少,所以我们不需要掌握,如果有一天真的要修改表结构,可以使用工具
修改表结构的操作时不需要写到java程序中的,实际上也不是java程序员的范畴。
约束
什么是约束?
约束对应的英语单词:constraint
在创建表的时候,我们可以给表中的字段加上一些约束,来保证这个表中数据的完整性、有效性。
约束的作用就是为了保证:表中的数据有效
约束包括那些?
非空约束:not null
唯一性约束:unique
主键约束:primary key (简称PK)
外键约束:foreign key (简称FK)
检查约束:check(mysql不支持,oracle支持)
我们在这里重点学习四个约束:
非空约束(not null),唯一性约束(unique)。主键约束(primary key),外键约束(foreign key)。
非空约束(not null)
非空约束not null约束的字段不能为null
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null//not null只有列级约束,没有表级约束
);
insert into t_vip(id,name)values(1,'zhangsan');
insert into t_vip(id,name)values(2,'lisi');
insert into t_vip(id)values(3);//name 不能为空,会报错
小插曲:
xxxx.sql这种文件被称为sql脚本文件。
sql脚本文件中编写了大量的sql语句
我们执行sql脚本文件的时候,该文件中所有的sql语句会全部执行
批量的执行sql语句,可以使用sql脚本文件
在mysql中怎么执行sql脚本呢?
用命令的方式:source 路径
你在实际的工作中,第一天到了公司,项目经理就会给你一个xxx.sql文件,你执行这个脚本文件,你电脑上的数据库数据就有了
唯一性约束:unique
唯一性约束unique约束的字段不能重复,但是可以为null
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique,
email varchar(255)
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com');
t_vip(id,name,email)values(2,'lisi','lisi@123.com');
t_vip(id,name,email)values(3,'wangwu','wangwu@123.com');
select * from t_vip;
insert into t_vip(id,name,email)values(4,'wangwu','wangwu@sina.com');//这时候再擦汇入这条数据,因为name的唯一性,所以报错
insert into t_vip(id) values(4);
insert into t_vip(id) values(5);
name字段虽然被unique约束了,但是可以为null。
新需求:name和email两个字段联合起来具有唯一性
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) unique,//约束直接添加到列后面,叫做列级约束。
email varchar(255) unique
);
这张表这样创建是不符合以上的‘新需求’的
这样创建表示:name具有唯一性,email具有唯一性,各自唯一。
以下这样的数据符合‘新需求’
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com')
insert into t_vip(id,name,email)values(2,'zhangsan','zhangsan@sina.com')
怎么创建这样的表,才能符合新需求呢?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
email varchar(255),
unique(name,email)//约束没有添加在列后面,这种约束被称为表级约束。
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com')
insert into t_vip(id,name,email)values(2,'zhangsan','zhangsan@sina.com')
select * from t_vip;
name和email两个字段联合起来唯一
insert into t_vip(id,name,email)values(3,'zhangsan','zhangsan@sina.com')//这时候在添加该条记录将会报错
什么时候使用表级约束呢?
需要给多个字段联合起来添加某一个约束的时候,需要使用表级约束。
unique和not null可以联合吗?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255) not null unique
);
desc t_vip;//这时候,我们再看表结构,拥有not null和unique两个约束的字段key中会显示主键
在mysql当中,如果一个字段同时被not null和unique约束的话,该字段自动变成主键字段。(注意:oracle中不一样!)
insert into t_vip(id,name)values(1,'zhangsan');
insert into t_vip(id,name)values(2,'zhangsan');//错误了,name不能重复
insert into t_vip(id)values(2);//错误了,name不能为null
主键约束(primary key,简称PK)
主键约束的相关术语
主键约束:一种约束
主键字段:该字段上添加了主键约束,这样的字段叫做:主键字段
主键值:主键字段中每一个值都叫做:主键值
什么是主键?有什么用?
主键值是每一行记录的唯一标识
主键值是每一行记录的身份证号
任何一张表都应该有主键,没有主键,表无效
主键特征:not null + unique (主键值不能是null,同时也不能重复)
如何给一张表添加主键约束?
drop table if exists t_vip;
create table t_vip(
id int primary key,//列级约束
name varchar(255)
);
insert into t_vip(id,name) values(1,'zhangsan');
insert into t_vip(id,name) values(2,'lisi');
//错误:主键不能重复
insert into t_vip(id,name) values(2,'wangwu');
//错误:主键不能为NULL
insert into t_vip(name) values('zhaoliu');
可以使用表级约束添加主键吗?
drop table if exists t_vip;
create table t_vip(
id int,
name varchar(255),
primary key(id)//表级约束
);
答案:可以
表级约束主要是给多个字段联合起来添加约束?
drop table if exists t_vip;
//id和name联合起来做主键:复合主键
create table t_vip(
id int,
name varchar(255),
email varchar(255),
primary key(id,name)
);
insert into t_vip(id,name,email)values(1,'zhangsan','zhangsan@123.com');
insert into t_vip(id,name,email)values(1,'lisi','lisi@123.com');
# 在实际开发中不建议使用:复合主键,建议使用单一主键
# 因为主键值存在的意义就是这行记录的身份证号,只要意义达到即可,单一主键可以做到,复合主键比较复杂,不建议使用
一个表主键约束能加两个吗?
drop table if exists t_vip;
create table t_vip(
id int primary key,
name varchar(255) primary key
);
ERROR 1068 (42000):Multiple primary key defined
结论:一张表,主键约束只能添加1个
- 主键值建议使用:int,bigint,char,等类型
- 不建议使用:varchar来做主键,主键值一般都是数字,一般都是定长的。
除了单一主键和复合主键之外,还可以分为自然主键和业务主键。
- 自然主键:主键值是一个自然数,和业务没关系。
- 业务主键:主键值和业务紧密关联,例如拿银行卡账号做主键值,这就是业务主键。
在实际开发中使用业务主键多还是自然主键多一些?
- 自然主键使用的比较多,因为主键只要做到不重复就行,不需要有意义。
- 业务主键不好,因为主键一旦和业务挂钩,那么当业务发生变动的时候,可能会影响到主键值,所以业务主键不建议使用,尽量使用自然主键。
在mysql当中,有一种机制,可以帮助我们自动维护一个主键值
drop table if exists t_vip;
create table t_vip(
id int primary key auto_increment,//auto_increment表示自增,从1开始,以1递增
name varchar(255)
);
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
insert into t_vip(name) values('zhangsan');
select * from t_vip;
外键约束(foreign key 简称FK)
- 外键约束涉及到的相关术语:
- 外键约束:一种约束(foreign key)
- 外键字段:该字段上添加了外键约束
- 外键值:外键字段当中的每一个值
业务背景:
- 请设计数据库表,来描述‘班级和学生’的信息
第一种方案:班级和学生存储在一张表中
缺点:数据冗余,空间浪费
第二种方案:班级一张表、学生一张表
t_class 班级表
classno(pk) classname
-------------------------------------------------------
100 河南省某某市第一高级中学高三1班
101 河南省某某市第一高级中学高三2班
t_student 学生表
no(pk) name cno(FK引用t_class这张表的classno)
----------------------------------------------------------------
1 jack 100
2 lucy 100
3 lilei 100
4 hanmeimei 100
5 zhangsan 100
6 lisi 100
7 wangwu 100
8 zhaoliu 100
当cno字段没有任何约束的时候,可能会导致数据无效。可能出现102,但是102班级不存在,所以为了保证cno字段中的值都是100和101,需要给cno字段添加外键约束。
那么:cno字段就是外键字段,cno字段中的每一个值都是外键值。
注意:t_class是父表,t_student是子表
删除表的顺序:先删子,再删父
创建表的顺序:先创建父,再创建子
删除数据的顺序:先删子,再删父
插入数据的顺序:先插入父,再插入子
//先删子,再删父
drop table if exists t_student;
drop table if exists t_class;
//先创建父,在创建子
create table t_class(
classno int primary key,
classname varchar(255)
);
create table t_student(
no int primary key auto_increment,
name varchar(255),
cno int,
foreign key(cno) references t_class(classno)//外键约束
);
思考:
1. 子表中的外键引用的父表中的某个字段,被引用的这个字段必须是主键吗?
答:不一定是主键,但至少具有unique约束(唯一性约束)
2. 外键可以为NULL吗?
答:外键值可以为NULL
存储引擎(了解)
什么是存储引擎,有什么用?
- 存储引擎是Mysql中特有的一个术语,其他数据库种没有。(Oracle中有,但不叫这个名字)
- 存储引擎实际上是一个表存储/组织数据的方式。
- 不同的存储引擎,表存储数据的方式不同。
怎么给表添加/指定‘存储引擎’呢?
- 在建表时指定存储引擎。
- ENGINE来指定存储引擎。
- CHARSET来指定这张表的字符编码方式。
- Mysql默认存储引擎是:InnoDB
- Mysql默认字符编码方式是:utf8
例:
create table t_product(
id int primary key,
name varchar(255)
)ENGINE=InnoDB default charset=gbk;
怎么查看Mysql支持那些存储引擎、Mysql版本查看方式?
- 利用命令查看Mysql存储引擎:show engines \G
- 利用命令查看Mysql版本:select version();
- Mysql支持九大存储引擎,版本不同支持引擎数量不同。
关于Mysql常用存储引擎介绍
MyISAM存储引擎特征
- 使用三个文件表示每个表:
- 格式文件——存储表结构的定义(mytable.frm)
- 数据文件——存储表行的内容(mytable.MYD)
- 索引文件——存储表上索引(mytable.MYI):索引是一本书的目录,缩小扫描范围,提高查询效率的一种机制。
- 可被转换为压缩、只读表来节省空间
- MyISAM不支持事务机制,安全性低。
- 提示:
- 对于一张表来说,只要是主键。
- 加有unique约束的字段上会自动创建索引。
InnoDB存储引擎
- 这是Mysql默认存储引擎,同时也是一个重量级的存储引擎。
- InnoDB支持事务,支持数据库崩溃后自动恢复机制。
- InnoDB存储引擎最主要的特点是:非常安全。
InnoDB存储引擎特点
- 每个InnoDB表在数据库目录中以.frm格式文件表示
- InnoDB表空间tablespace被用于存储表的内容(表空间是一个逻辑名称,表空间存储数据+索引)
- 提供一组用来记录事务性活动的日志文件
- 用COMMIT(提交)、SAVEPOINT及ROLLBACK(回滚)支持事务处理
- 提供全ACID兼容
- 在Mysql服务器崩溃后提供自动恢复
- 多版本(MVCC)和行级锁定
- 支持外键及引用的完整性,包括级联删除和更新
- InnoDB最大的特点就是支持事务,以保证数据的安全。效率不是很高,并且不能压缩,不能转换为只读。
MEMORY存储引擎
- 使用MEMORY存储引擎的表,其数据存储在内存中,且行的长度固定,这两个特点使得MEMORY存储引擎非常快。
MEMORY存储引擎管理的表具有以下特征:
- 在数据库目录内,每个表均以.frm格式的文件表示。
- 表数据及索引被存储在内存中。(目的就是快,查询快)
- 表级锁机制。
- 不能包含TEXT或BLOB字段。
- MEMORY存储引擎以前被称为HEAP引擎。
- MEMORY引擎优点:查询效率是最高的,不需要和硬盘交互。
- MEMORY引擎缺点:不安全,关机后数据消失,因为数据和索引是在内存当中的。
事务
什么是事务?
- 一个事务其实就是一个完整的业务逻辑。
什么是一个完整的业务逻辑
- 假设转账,从A账户向B账户转账1w
- 将A账户的钱减去1w(update语句)
- 将B账户的钱加上1w(update语句)
- 这就是一个完整的业务逻辑。
- 以上的操作是一个最小的工作单元,要么同时成功,要么同时失败,不可再分。
- 这两个update语句要求必须同时成功或者同时失败,这样才能保证钱是正确的。
只有DML语句才有事务,其他语句和事务无关
- insert
- delete
- update
- 只有以上三个语句和事务有关,其他的都没有关系
- 因为只要以上的三个语句是数据库表中数据进行增、删、改的。
- 只要你的操作一旦涉及到数据的增删改,那么一定要考虑安全问题。
- 数据安全第一位
- 思考
- 问:假设所有的业务只要一条DML语句就能完成,还有必要存在事务机制吗?
- 答:没必要,正是因为做某件事的时候,需要多条DML语句共同联合起来才能完成,所以需要事务的存在。如果任何一件复杂的事都能用一条DML语句搞定,那么事务则没有存在的价值。
- 一个事务其实就是多条DML语句同时成功,或者同时失败。
- 事务:批量的DML语句同时成功,或者同时失败
事务是怎么做到多条DML语句同时成功和同时失败的呢?
- InnoDB存储引擎:提供一组用来记录事务性活动的日志文件
事务开启了:
insert
insert
insert
delete
update
update
update
事务结束了!
- 在事务的执行过程中,每一条DML语句的操作都会记录到“事务性活动的日志文件”种。
- 在事务的执行过程中,我们可以提交事务,也可以回滚事务。
- 提交事务:
- 清空事务性活动的日志文件,将数据全部彻底持久化到数据库表中。
- 提交事务标志着事务的结束,并且是一种全部成功的结束。
- 回滚事务:
- 将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件
- 回滚事务标志着事务的结束,并且是一种全部失败的结束。
怎么提交事务,怎么回滚事务?
- 提交事务:commit语句
- 回滚事务:rollback语句
- 事务对应的英语单词:transaction
- Mysql默认情况下是支持自动提交事务的。
- 自动提交:每执行一条DML语句,则提交一次。
- 这种自动提交实际上是不符合我们的开发习惯,因为一个业务通常是需要多条DML语句共同执行才能完成的,为了保证数据的安全,必须要求同时成功之后在提交,所以不能执行一条就提交一次。
如何关闭Mysql自动提交机制
- 在操作执行之前:start transaction;//关闭自动提交机制
- 在所有操作完成之后,输入:commit 进行提交事务
事务的四个特性
- A:原子性:说明事物是最小的工作单元,不可再分。
- C:一致性:所有事物要求,在同一个事务当中,所有操作必须同时成功,或者同时失败,以保证数据的一致性。
- I:隔离性:A事务和B事务之间具有一定的隔离。
- 例如:教室A和教室B之间有一道墙,这道墙就是隔离性。A事务在操作一张表的时候,B事务也操作这张表会怎样
- D:持久性:事务最终结束的一个保障,事务提交就相当于将没有保存到硬盘上的数据保存到硬盘上。
事务的隔离性
例:
A教室和B教室中间有一道墙,这道墙可以很厚,也可以很薄,这就是事物的隔离级别,这道墙越厚,表示隔离级别越高。
事务和事务之间的隔离级别有哪些?四个级别
1. 读未提交:read uncommitted(最低隔离级别)(没有提交就读到了)
什么是读未提交?
事务A可以读取到事务B未提交的数据。
这种隔离级别存在的问题:
脏读现象(Dirty Read)
我们称读到了脏数据。
这种隔离级别一般都是理论上的,大多数的数据库隔离级别都是二档起步!
2. 读已提交:read committed(提交之后读到)
2.1 什么是读已提交?
事务A只能读取到事务B提交之后的数据。
这种隔离级别解决了脏读现象。
这种隔离级别存在的问题:
不可重复读取数据。
2.2 什么是不可重复读取数据?
在事务开启之后,第一次读到的数据是3条,当前事务还没有结束,可能第二次在读取的时候,读到的数据是4条,3不等于4称为不可重复读取。
这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实。
Oracle数据库默认隔离级别:read committed
3. 可重复读:repeatable read(提交之后也读不到,永远读取的都是刚开启事务时的数据)
3.1 什么是可重复读取?
事务A开启之后,不管是多久,每次在事务A中读取到的数据都是一致的,即使事务B将数据已经修改,并且提交了,事务A读到的数据还是没有发生改变,这就是可重复读。
3.2 可重复读解决了什么问题?
解决了不可重复读取数据。
3.3 可重复读存在的问题是什么?
会出现幻影读。
每一次读取到的数据都是幻想,不够真实
早晨9点钟开启了事务,只要事务不结束,到晚上9点,读到的数据还是那样。
Mysql中默认的事务隔离级别就是这个
3.4 举例
银行总账可能需要执行一条select语句,这条select语句可能从下午1点开始执行到下午3点才能结束,1点到3点中有没有可能有人存款和取款?为了保证存取款对自己的数据没有影响,要用到可重复读repeatable,也就是第三级别
1点开始——3点结束,这个结果应该是1点钟时候的结果
4. 序列化/串行化:serializable(最高隔离级别)
这是最高隔离级别,效率最低,解决了所有的问题。
这种隔离级别表示事务排队,不能并发。(我操作的时候你停,你操作的时候我停,直到我操作完你才能进行操作)
synchronized,线程同步(事务同步)
每一次读取到的数据都是最真实的,并且效率是最低的。
验证各种隔离级别
- 查看当前事务隔离级别:select @@tx_isolation;
- 设置全局隔离级别:set global transaction isolation level read uncommitted;
1. 验证(读未提交):read uncommited,先设置全局隔离级别
事务A 事务B
use bjpowernode;
use bjpowernode;
start transaction;
select * from t_user;
seart transaction;
insert into t_user values('zhangsan');
select * from t_user;
//在没有提交事务的时候,左边就可以查询到右边未提交的事务数据。
2. 验证(读已提交):read commited,先设置全局隔离级别
事务A 事务B
use bjpowernode;
use bjpowernode;
start transaction;
seart transaction;
select * from t_user;
insert into t_user values('zhangsan');
select * from t_user;
commit;
select * from t_user;
3. 验证(可重复读):repeatable read,先设置全局隔离级别
事务A 事务B
use bjpowernode;
use bjpowernode;
start transaction;
seart transaction;
select * from t_user;
insert into t_user values('zhangsan');
insert into t_user values('lisi');
commit;
select * from t_user;
4. 验证(序列化):serializable,先设置全局隔离级别
事务A 事务B
use bjpowernode;
use bjpowernode;
start transaction;
seart transaction;
select * from t_user;
insert into t_user values('abc');
select * from t_user;
索引
什么是索引?
- 索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。
- 一张表的一个字段可以添加一个索引,多个字段联合起来也可以添加索引。
- 索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
举例:
对于一本字典来说,查找某个汉字有两种方式:
第一种方式:一页一页挨着找,直到找到为止,这种查找方式属于全字典扫描,效率比较低。
第二种方式:先通过目录(索引)去定位一个大概的位置,然后直接定位到这个位置,做局域性扫描,缩小扫描范围,快速的查找,这种查找方式属于通过索引检索,效率较高。
t_user
id(idIndex) name(nameIndex)
---------------------------------
1 zhangsan
2 lisi
3 wangwu
4 zhaoliu
select * from t_user where name ='zhaoliu';
以上的这条SQL语句会去name字段上扫描
因为查询条件是:name='zhaoliu';
如果name字段上没有添加索引(目录),或者说没有给name字段创建索引,Mysql会进行全扫描,会将name字段上的每一个值都对比一遍,效率比较低。
Mysql在查询方面主要就是两种方式:
第一种:全表扫描
第二种:根据索引检索
注意:在实际中,汉语字典前面的目录是排序的,按照abcd....
为什么排序呢?因为只有排序了才会有区间查找这一说(缩小扫描范围,其实就是扫描某个区间罢了)
在mysql数据库当中索引也是需要排序的,并且这个索引的排序和TreeSet数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql当中索引是一个B-Tree数据结构。
遵循左小右大原则存放,采用中序遍历方式遍历取数据。
索引的实现原理
t_user
id(PK) name
-------------------------
100 zhangsan
200 lisi
35 wangwu
46 zhaoliu
提醒1:在任何数据库当中主键上都会自动添加索引对象,id字段上自动有索引,因为id是PK。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的方式存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中索引存储在一个逻辑名称叫做tablespace的当中,在MEMORy存储引擎当中索引被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式存在。((自平衡二叉树:B-Tree)
- 索引的实现原理:就是缩小扫描范围,避免全表扫描。
- 表中字段不会动,索引对象会排序
- 在mysql当中,主键上,以及unique字段上都会自动添加索引。
什么情况下,我们会考虑给字段添加索引?
- 条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同)
- 条件2:该字段经常出现在where后面,以条件的形式存在,也就是说这个字段总是被扫描。
- 条件3:该字段很少的DML操作(insert delete update)。(因为DML之后,索引需要重新排序)
- 建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。
- 建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。
如何创建、删除索引
例:
给name添加索引
create index emp_ename_index on emp(ename);
//给emp表的ename字段添加索引,起名:emp_ename_index
删除索引
drop index emp_ename_index on emp;
将emp表上的emp_ename_index索引删除
如何查看一个SQL语句是否使用了索引进行检索?
explain select * from emp where ename ='KING';
//扫描14条记录:说明没有使用索引。type=ALL
create index emp_ename_index on emp(ename);
//扫描一条记录,type=ref,说明添加了索引
索引有失效的时候,什么时候索引失效?
- 索引是各种数据库进行优化的重要手段,
- 优化的时候有限考虑的因素就是索引。
失效的第一种情况:
select * from emp where ename like '%T';
//ename上即使添加了索引,也不会走索引
//是因为模糊匹配当中以'%'开头了没有办法进行索引进行检索
//尽量避免模糊查询的时候以'%'开始,这是一种优化的手段/策略。
explain select * from emp where ename like '%T';
失效的第二种情况:
explain select * from emp where ename = 'KING' or job = 'MANAGER';
使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个字段上的索引也会失效。所以这就是为什么不建议使用or的原因。
失效的第三种情况:
create index emp_job_sal_index on emp(job,sal);
explain select * from emp where job = 'MANAGER';
explain select * from emp where sal = '800';
使用复合索引的时候,没有使用左侧的列查找,索引失效
复合索引:两个字段或者更多的字段联合起来,添加一个索引,叫做复合索引
失效的第四种情况:
create index emp_sal_index on emp(sal);
explain select * from emp where sal = 800;
explain select * from emp where sal+1 = 800;
在where当中索引列(字段)参加了运算,索引失效。
失效的第五种情况:
explain select * from emp where lower(ename) = 'smith';
在where当中索引列使用了函数,索引失效
.......
- 索引在数据库当中分了很多类
索引分类
- 单一索引:一个字段上添加索引。
- 复合索引:两个或更多字段上添加索引。
- 主键索引:主键上添加索引。
- 唯一性索引:具有unique约束的字段上添加索引。
- …
- 注意:唯一性比较弱的字段上添加索引用处不大。
视图
什么是视图?
- view:站在不同的角度去看待同一份数据
如何创建、删除视图对象?视图对象有什么作用?
- 创建视图对象:create view emp_view as select * from emp;
//把这个查询结果当作视图创建出来
1.创建视图:
表复制:create table dept2 sa select * from dept;
查询复制的表:select * from dept2;
创建视图对象:create view dept2_view as select * from dept2;
2.删除视图:
drop view dept2_view;
注意:只有DQL语句才能以view的形式创建。
create view view_name as 这里的语句必须是DQL语句
3.视图可以做什么?
我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致原表被操作。
//视图的特点:通过对视图的操作,会影响到原表数据。
//面向视图查询
select * from dept2_view;
//面向视图插入
insert into dept2_view(deptno,dname,loc)values(60,'SALES','BEIJING');
//查询原表数据
select * from dept2;
//面向视图删除
delete from dept2_view;
//查询原表数据
select * from dept2;
//创建视图对象
create view
emp_dept_view
as
select
e.ename,e.sal,d.dnam
from
emp e
join
dept d
on
e.deptno = d.deptno;
//查询视图对象
select * from emp_dept_view;
//面向视图更新
update emp_dept_view set sal = 1000 where dname = 'ACCOUNTING';
//原表数据被更新
select * from emp;
4.视图对象在实际开发中到底有什么用?
《方便,简化开发,利于维护》
假设有一条非常复杂的sql语句,而这条sql语句需要在不同的位置上反复使用。
每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦怎么办?
可以把这条复杂的sql语句以视图对象的形式新建。
在需要编写这条sql语句的位置直接使用视图对象,可以大大简化开发。
并利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的sql语句。
我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。
可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是存储在硬盘上,不会消失。
- 视图对应的语句只能是DQL语句(as后面的语句)
- 但是视图对象创建完成之后,可以对视图进行增删改查等操作。
- 增删改查,又叫做:CRUD
- CRUD是在公司中程序员之间沟通的术语,一般我们很少说增删改查。一般都说CRUD。
- C:Create(增)
- R:Retrive(查:检索)
- U:Update(改)
- D:Delete(删)
DBA常用命令
- 重点掌握数据的导入和导出(数据备份)
- 其他命令可以另作了解
数据导出:
mysqldump 数据库名 >D:\数据库名.sql -uroot -p123456
删除数据库:
drop database 数据库名;
导入数据库:
source D:\数据库名.sql
数据导出注意:在windows的dos命令窗口中进行
导出指定的表?
mysqldump 数据库名 emp>D:\数据库名.sql -uroot -p123456
数据导入注意:
需要先登录到mysql数据库服务器上。
然后创建数据库:create database 数据库名。
使用数据库:use 数据库名
然后初始化数据库:source D:\数据库名.sql
数据库设计三范式
什么是数据库设计范式?
- 数据库表的设计依据,教你怎么进行数据库表的设计。
数据库设计范式共有?
- 第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。
- 第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,不要产生部份依赖。
- 第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,不要产生传递依赖。
- 声明:三范式是面试官经常问的,所以一定要熟记在心
- 设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。
第一范式
- 最核心,最重要的范式,所有表的设计都需要满足,必须有主键,并且每一个字段都是原子性不可再分。
学生编号 学生姓名 联系方式
---------------------------------------------
1001 张三 zs@gmail.com,135999999
1002 李四 ls@gmail.com,135999999
1001 王五 ww@gmail.com,135999999
以上是学生表,满足第一范式吗?
答:不满足
第一:没有主键
第二:联系方式可以分为邮箱地址和电话
第二范式:
- 建立在第一范式基础之上。
- 要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
- 这张表描述了学生和老师的关系:一个学生可能有多个老师,一个老师有多个学生
- 这是非常典型的多对多关系
学生编号 学生姓名 教师编号 教师姓名
---------------------------------------
1001 张三 001 王老师
1002 李四 002 赵老师
1003 王五 001 王老师
1001 张三 002 赵老师
以上表是否满足第一范式?
不满足,可以进行修改
学生编号+教师编号(PK) 学生姓名 教师姓名
---------------------------------------
1001 001 张三 王老师
1002 002 李四 赵老师
1003 001 王五 王老师
1001 002 张三 赵老师
学生编号 教师编号,两个字段联合做主键,复合主键(PK:学生编号+教师编号)
经过修改之后,以上的表满足第一范式,但是满足第二范式吗?
不满足,'张三'依赖1001,'王老师'依赖001,显然产生了部分依赖
产生部份依赖有什么缺点?
数据冗余,空间浪费。'张三'重复了,'王老师'重复了
为了让以上表满足第二范式,需要这样设计:
使用三张表来表示多对多关系
学生表
学生编号(pk) 学生姓名
------------------------------
1001 张三
1002 李四
1003 王五
教师表
教师编号(pk) 教师姓名
------------------------------
001 王老师
002 赵老师
学生教师关系表
id(pk) 学生编号(fk) 教师编号(fk)
-------------------------------------------------
1 1001 001
2 1002 002
3 1003 001
4 1001 002
口诀
多对多怎么设计:多对多,三张表,关系表两个外键
第三范式
- 第三范式建立在第二范式的基础之上,要求所有非主键字段必须直接依赖主键,不要产生传递依赖
学生编号(PK) 学生姓名 班级编号 班级名称
-----------------------------------------------------------------
1001 李四 01 一年一班
1002 张三 02 一年二班
1003 王五 03 一年三班
1004 赵六 03 一年三班
分析以上表是否满足第一范式?
满足第一范式,有主键
分析以上表是否满足第二范式?
满足第二范式,因为主键不是复合主键,没有产生部份依赖,主键是单一主键。
分析以上表是否满足第三范式?
第三范式要求:不要产生传递依赖!
一年一班依赖01,01依赖1001,产生传递依赖
所以不符合第三范式要求,产生数据冗余。
那么如何设计一对多呢?
班级表:
班级编号(PK) 班级名称
----------------------------------
01 一年一班
02 一年二班
03 一年三班
学生表:
学生编号(PK) 学生姓名 班级编号(fk)
------------------------------------------------------
1001 张三 01
1002 李四 02
1003 王五 03
1004 赵六 03
口诀:
一对多,两张表,多的表加外键
总结表设计
- 一对多:一对多,两张表,多的表加外键
- 多对多:多对多,三张表,关系表两个外键
- 一对一:一对一,外键唯一
一对一放到一张表中不就行了吗?为什么要拆表?
在实际开发中,可能存在一张表字段太多,太庞大,这个时候要拆分表。一对一怎么设计?
一对一:
没有拆分之前:一张表
t_user
id login_name login_pwd real_name email address...
----------------------------------------------------------------------------
1 zhangsan 123 张三 zhangsan@xxx
2 lisi 123 李四 lisi@xxx
....
这种庞大的表建议拆分为两张表:
t_login 登陆信息表
id(pk) login_name login_pwd
---------------------------------
1 zhangsan 123
2 lisi 123
t_user 用户详细信息表
id(pk) real_name email address...... login_id(fk_unique)
--------------------------------------------------------------------------------------
100 张三 zhangsan@xxx 1
200 李四 lisi@xxx 2
- 数据库设计三范式是理论上的,实践和理论有时候有偏差。
- 最终的目的都是为了满足客户的需求,有的时候会拿冗余换执行速度。
- 因为在sql当中,表和表之间连接次数越多,效率越低。(笛卡尔积)
- 有的时候可能会存在冗余,但是为了减少表的连接次数,这样做也是合理的,并且对于开发人员来说,sql语句的编写执行难度也会降低。