数据库高级

第一章 数据完整性

1.1 数据库的完整性

用来保证存放到数据库中的数据是有效的,即数据的有效性和准确性

确保数据的完整性 = 在创建表时给表中添加约束

完整性的分类:

  • 实体完整性(行完整性):

  • 域完整性(列完整性):

  • 引用完整性(关联表完整性):

    • 主键约束:primary key
    • 唯一约束:unique [key]
    • 非空约束:not null
    • 默认约束:default
    • 自动增长:auto_increment
    • 外键约束: foreign key

建议这些约束应该在创建表的时候设置

多个约束条件之间使用空格间隔

示例:

create table student( 
    studentno int primary key auto_increment, 
    loginPwd varchar(20) not null default '123456', 
    studentname varchar(50) not null, 
    sex char(2) not null, 
    gradeid int not null, 
    phone varchar(255) not null, 
    address varchar(255) default '学生宿舍', 
    borndate datetime, 
    email varchar(50) 
);

1.2 实体完整性

实体:即表中的一行(一条记录)代表一个实体(entity)

实体完整性的作用:标识每一行数据不重复。

约束类型:

  • 主键约束(primary key
  • 唯一约束**(unique)**
  • 自动增长列**(auto_increment)**

1.2.1 主键约束(primary key)

注:每个表中要有一个主键。

特点:数据唯一,且不能为null

示例:

第一种添加方式:

CREATE TABLE student( id int primary key, name varchar(50) );

第二种添加方式:此种方式优势在于,可以创建联合主键

CREATE TABLE student( id int, name varchar(50), primary key(id) );

CREATE TABLE student( classid int, stuid int, name varchar(50), primary key(classid,stuid) );

第三种添加方式:

CREATE TABLE student( id int, name varchar(50) ); 
ALTER TABLE student ADD PRIMARY KEY (id);

1.2.2 唯一约束(unique)

特点:数据不能重复

CREATE TABLE student( Id int primary key, Name varchar(50) unique );

1.2.3 自动增长列(auto_increment)

sqlserver数据库 (identity-标识列)

oracle数据库(sequence-序列)

给主键添加自动增长的数值,列只能是整数类型

CREATE TABLE student( Id int primary key auto_increment, Name varchar(50) ); 
INSERT INTO student(name) values(‘tom’);

1.3 域完整性

域完整性的作用:限制此单元格的数据正确,不对照此列的其它单元格比较

域代表当前单元格

域完整性约束:数据类型 非空约束(not null) 默认值约束(default)

check约束(mysql不支持)check(sex=‘男’ or sex=‘女’)

1.3.1 数据类型

数值类型

类型大小范围(有符号)范围(无符号)用途
tinyint1字节(-128,127)(0,255)小整数值
smallint2 字节(-32768,32767)(0,65535)大整数值
mediumint3 字节(-8388608,8388607)(0,16777215)大整数值
INT4字节(-2147483648,2147483647)(0,4294967295)大整数值
bigint8字节极大整数值
flfloat4字节单精度浮点数值
double8字节双精度浮点数值

日期类型:

表示时间值的日期和时间类型为DATETIME、DATE、TIMESTAMP、TIME和YEAR。

每个时间类型有一个有效值范围和一个"零"值,当指定不合法的MySQL不能表示的值时使用"零"值。

TIMESTAMP类型有专有的自动更新特性

类型大小(字节)范围格式用途
DATE31000-01-01/9999-12-31YYYY-MM-DD日期值
TIME3‘-838:59:59’/‘838:59:59’HH:MM:SS时间值或持续时间
YEAR11901/2155YYYY年份值
DATETIME81000-01-01 00:00:00/9999-12-31 23:59:59YYYY-MM-DD HH:MM:SS混合日期和时间值
TIMESTAMP41970-01-01 00:00:00/2038 结束时间是第 *2147483647* 秒,北京时间 *2038-1-YYYYMMDD HHMMSS混合日期和时间值,时间戳 ,当更新数据的时候自动添加更新时间

字符串类型:

字符串类型指CHAR、VARCHAR、BINARY、VARBINARY、BLOB、TEXT、ENUM和SET

类型大小用途
CHAR0-255字节定长字符串
VARCHAR0-65535 字节变长字符串
TINYBLOB0-255字节不超过 255 个字符的二进制字符串
TINYTEXT0-255字节短文本字符串
BLOB0-65 535字节二进制形式的长文本数据
TEXT0-65 535字节长文本数据
MEDIUMBLOB0-16 777 215字节二进制形式的中等长度文本数据
MEDIUMTEXT0-16 777 215字节中等长度文本数据
LONGBLOB0-4 294 967 295字节二进制形式的极大文本数据
LONGTEXT0-4 294 967 295字节极大文本数据

CHAR和VARCHAR类型类似,但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。在存储或检索过程中不进行大小写转换。

BINARY和VARBINARY类似于CHAR和VARCHAR,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值。

BLOB是一个二进制大对象,可以容纳可变数量的数据。有4种BLOB类型:TINYBLOB、BLOB、MEDIUMBLOB和LONGBLOB。它们只是可容纳值的最大长度不同。

有4种TEXT类型:TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT。这些对应4种BLOB类型,有相同的最大长度和存储需求。

1.3.2 非空约束

not null

CREATE TABLE student( 
    Id int primary key, 
    Name varchar(50) not null, 
    Sex varchar(10) 
); 

INSERT INTO student values(1,’tom’,null);

1.3.3 默认值约束

default

CREATE TABLE student( 
    Id int primary key, 
    Name varchar(50) not null, 
    Sex varchar(10) default '男' 
); 
insert intostudent1 values(1,'tom','女');
insert intostudent1 values(2,'jerry',default);

1.4 引用完整性

(参照完整性)

外键约束:FOREIGN KEY

示例:

CREATE TABLE student(
    id int primary key, 
    name varchar(50) not null, 
    sex varchar(10) default '男' 
); 
create table score( 
    id int primary key, 
    score int, sid int , 
    constraint fk_score_sid foreign key(sid) references student(id) 
);

constraint 自定义外键名称 foreign key(外键列名) references 主键表名(主键列名)

外键列的数据类型一定要与主键的类型一致

第二种添加外键方式。

ALTER TABLEscore1 ADD CONSTRAINT fk_stu_score FOREIGN KEY(sid) REFERENCES stu(id);

第二章 多表查询

多个表之间是有关系的,那么关系靠谁来维护?

多表约束:外键列

2.1 多表的关系

2.1.1 一对多/多对一关系

客户和订单,分类和商品,部门和员工.

一对多建表原则:在多的一方创建一个字段,字段作为外键指向一的一方的主键

2.1.2 多对多关系

学生和课程

多对多关系建表原则:需要创建第三张表,中间表中至少两个字段,这两个字段分别作为外键指向各自一方的主键。

2.1.3 一对一关系

在实际的开发中应用不多.因为一对一可以创建成一张表.

两种建表原则:

**唯一外键对应:**假设一对一是一个一对多的关系,在多的一方创建一个外键指向一的一方的主键,将外键设置为unique。

主键对应:让一对一的双方的主键进行建立关系。

2.2多表查询

多表查询有如下几种:

  1. 合并结果集:UNION 、 UNION ALL

  2. 连接查询

    2.1 内连接 [INNER] JOIN ON

    ​ 2.2 外连接 OUTER JOIN ON

    ​ - 左外连接 LEFT [OUTER] JOIN

    ​ - 右外连接 RIGHT [OUTER] JOIN

     	- 全外连接(MySQL不支持)FULL JOIN 
    

    ​ 2.3 自然连接

  3. 子查询

2.2.1 合并结果集

作用:合并结果集就是把两个select语句的查询结果合并到一起!

合并结果集有两种方式:

(1)UNION:去除重复记录,例如:SELECT* FROM t1 UNION SELECT * FROM t2;

(2)UNION ALL:不去除重复记录,例如:SELECT * FROM t1 UNION ALL SELECT * FROM t2。

在这里插入图片描述在这里插入图片描述
注意:被合并的两个结果:列数、列类型必须相同。

2.2.2 连接查询

连接查询就是求出多个表的乘积,例如t1连接t2,那么查询出的结果就是t1*t2。
在这里插入图片描述
连接查询会产生笛卡尔积,假设集合A={a,b},集合B={0,1,2},则两个集合的笛卡尔积为{(a,0),(a,1),

(a,2),(b,0),(b,1),(b,2)}。可以扩展到多个集合的情况。

那么多表查询产生这样的结果并不是我们想要的,那么怎么去除重复的,不想要的记录呢,当然是通过 条件过滤。通常要查询的多个表之间都存在关联关系,那么就通过关联关系去除笛卡尔积。

示例 1:现有两张表

emp-员工表,dept-部门表

CREATE TABLE dept1( 
    deptno int primary key, 
    dname varchar(14), 
    loc varchar(13)
);
insert into dept1 values(10,'服务部','北京');
insert into dept1 values(20,'研发部','北京');
insert into dept1 values(30,'销售部','北京'); 
insert into dept1 values(40,'主管部','北京'); 
CREATE TABLE emp1( 
    empno int, ename varchar(50),
    job varchar(50), mgr int,
    hiredate date, 
    sal double,
    comm double, 
    deptno int 
);
insert into emp1 values(1001,'张三','文员',1006,'2019-1-1',1000,2010,10);
insert into emp1 values(1002,'李四','程序员',1006,'2019-2-1',1100,2000,20); 
insert into emp1 values(1003,'王五','程序员',1006,'2019-3-1',1020,2011,20); 
insert into emp1 values(1004,'赵六','销售',1006,'2019-4-1',1010,2002,30); 
insert into emp1 values(1005,'张猛','销售',1006,'2019-5-1',1001,2003,30); 
insert into emp1 values(1006,'谢娜','主管',1006,'2019-6-1',1011,2004,40);
select * from emp,dept;

在这里插入图片描述
使用主外键关系做为条件来去除无用信息

SELECT * FROM emp,dept WHERE emp.deptno=dept.deptno;

在这里插入图片描述
上面查询结果会把两张表的所有列都查询出来,也许你不需要那么多列,这时就可以指定要查询的列了。

SELECT emp.ename,emp.sal,emp.comm,dept.dname 
FROM emp,dept 
WHERE emp.deptno=dept.deptno;

在这里插入图片描述
一:内连接

上面的连接语句就是内连接,但它不是SQL标准中的查询方式,可以理解为方言!

语法:

select 列名  
from1 
inner join2 
on1.列名=2.列名 //外键列的关系 
where.....

等价于:

select 列名 
from1,2 
where1.列名=2.列名 and ...(其他条件)

注:<1>表1和表2的顺序可以互换

<2>找两张表的等值关系时,找表示相同含义的列作为等值关系。

<3>点操作符表示“的”,格式:表名.列名

<4>可以使用as,给表名起别名,注意定义别名之后,统一使用别名

示例:

//查询学生表中的学生姓名和分数表中的分数 
select name,score 
from student as s 
inner join scores as c 
on s.studentid=c.stuid 

等价于: 
select name,score 
from student as s,scores as c 
where s.studentid=c.stuid

三表联查:

语法:

 select 列名 from1 
 inner join2 on1.列名=2.列名 
 inner join3 on1或表2.列名=3.列名 where 

等价于:

select 列名 from1,2,3 
where1.列名=2.列名 and1/2.列名=3.列名 

SQL标准的内连接为:

SELECT * 
FROM emp e 
INNER JOIN dept d 
ON e.deptno=d.deptno;

内连接的特点:查询结果必须满足条件。

二:外连接

包括左外连接和右外连接,外连接的特点:查询出的结果存在不满足条件的可能。

  • 外联查询

    • 左外联:select 列名 from 主表 left join 次表 on 主表.列名=次表.列名

      1.主表数据全部显示,次表数据匹配显示,能匹配到的显示数据,匹配不成功的显示null

      2.主表和次表不能随意调换位置

使用场景:一般会作为子查询的语句使用

select depname,name from (
    select e.*,d.depname 
    from department d 
    left join employee e 
    on e.depid=d.depid ) aa 
where aa.name is null;

– 右外联:select 列名 from 次表 right join 主表 on 主表.列名=次表.列名

a.左外连接

SELECT * FROM emp e 
LEFT OUTER JOIN dept d 
ON e.deptno=d.deptno;

​ 左连接是先查询出左表(即以左表为主),然后查询右表,右表中满足条件的显示出来,不满足条件的显示NULL。

insert into emp values(1007,'何炅','主管',1006,'2019-6-1',1011,2004,50);

我们还是用上面的例子来说明。其中emp表中“张三”这条记录中,部门编号为50,而dept表中不存在部门编号为50的记录,所以“张三”这条记录,不能满足e.deptno=d.deptno这条件。但在左连接中,因为emp表是左表,所以左表中的记录都会查询出来,即“张三”这条记录也会查出,但相应的右表部分显示NULL。
在这里插入图片描述
b.右外连接

右连接就是先把右表中所有记录都查询出来,然后左表满足条件的显示,不满足显示NULL。例如在dept表中的40部门并不存在员工,但在右连接中,如果dept表为右表,那么还是会查出40部门,但相应的员工信息为NULL。

insert into dept values(60,'颜值部','成都');
SELECT * FROM emp e 
RIGHT OUTER JOIN dept d 
ON e.deptno=d.deptno;

在这里插入图片描述
连接查询心得

连接不限与两张表,连接查询也可以是三张、四张,甚至N张表的连接查询。通常连接查询不可能需要整个笛卡尔积,而只是需要其中一部分,那么这时就需要使用条件来去除不需要的记录。这个条件大多数情况下都是使用主外键关系去除。

两张表的连接查询一定有一个主外键关系,三张表的连接查询就一定有两个主外键关系,所以在大家不 是很熟悉连接查询时,首先要学会去除无用笛卡尔积,那么就是用主外键关系作为条件来处理。如果两 张表的查询,那么至少有一个主外键条件,三张表连接至少有两个主外键条件。

三.自然连接

自然连接(NATURAL INNER JOIN):自然连接是一种特殊的等值连接,他要求两个关系表中进行连接的必须是相同的属性列(名字相同),无须添加连接条件,并且在结果中消除重复的属性列。

下面给出几个例子。

语句:

select * from emp e natural join dept d;

2.2.3 子查询

一个select语句中包含另一个完整的select语句。

子查询就是嵌套查询,即SELECT中包含SELECT,如果一条语句中存在两个,或两个以上SELECT,那么就是子查询语句了。

l 子查询出现的位置:

a. where后,作为条为被查询的一条件的一部分;

b. from后,作表;

l 当子查询出现在where后作为条件时,还可以使用如下关键字:

a. any

b. all

l 子查询结果集的形式:

a. 单行单列(用于条件)

b. 单行多列(用于条件)

c. 多行单列(用于条件)

d. 多行多列(用于表)

示例:

1. 工资高于JONES的员工。

分析:

查询条件:工资>JONES工资,其中JONES工资需要一条子查询。

第一步:查询JONES的工资

SELECT sal FROM emp WHERE ename='JONES';

第二步:查询高于甘宁工资的员工

SELECT * FROM emp WHERE sal > (第一步结果);

结果:

SELECT * FROM emp WHERE sal > (SELECT sal FROM emp WHERE ename='JONES');

2. 查询与SCOTT同一个部门的员工。

l 子查询作为条件

l 子查询形式为单行单列

分析:

查询条件:部门=SCOTT的部门编号,其中SCOTT 的部门编号需要一条子查询。

第一步:查询SCOTT的部门编号

SELECT deptno FROM emp WHERE ename='SCOTT';

第二步:查询部门编号等于SCOTT的部门编号的员工

SELECT * FROM emp WHERE deptno = (SELECT deptno FROM emp WHERE ename='SCOTT');

3. 工资高于30号部门所有人的员工信息

分析:

SELECT * FROMemp WHERE sal>(SELECT MAX(sal) FROM emp WHERE deptno=30);

查询条件:工资高于30部门所有人工资,其中30部门所有人工资是子查询。高于所有需要使用all关键字。

第一步:查询30部门所有人工资

SELECT sal FROM emp WHERE deptno=30;

第二步:查询高于30部门所有人工资的员工信息

SELECT * FROM emp WHERE sal > ALL (第一步)

结果:

SELECT * FROM emp WHERE sal > ALL (SELECT sal FROM emp WHERE deptno=30)

l 子查询作为条件

l 子查询形式为多行单列(当子查询结果集形式为多行单列时可以使用ALL或ANY关键字)

第三章 综合练习

某网上商城数据库如下图所示
在这里插入图片描述

#一对多的实现 
#创建分类表
create table category( 
    cid varchar(32) PRIMARY KEY , # 分类id 
    cname varchar(100) #分类名称 
);

# 商品表 
CREATE TABLE `products` ( 
    `pid` varchar(32) PRIMARY KEY , #商品id 
    `name` VARCHAR(40) , #商品名称 
    `price` DOUBLE, # 价格 
    category_id varchar(32) # 分类id,外键列 
);

#多对多的实现 
#用户表 
create table users( 
    userid int, 
    username varchar(20), 
    upass varchar(20) 
);

#订单表 
create table `orders`( 
    `oid` varchar(32) PRIMARY KEY , #订单id
    `totalprice` double, #总计 
    uid int # 用户id 
);

# 订单项表 
create table orderitem( 
    oid varchar(50), #订单id 
    pid varchar(50) #商品id 
);

#初始化数据 
#给分类表初始化数据 
insert into category values('c001','电器'); 
insert into category values('c002','服饰'); 
insert into category values('c003','化妆品'); 
insert into category values('c004','书籍');

#给商品表初始化数据 
insert into products(pid,name,price,category_id) values('p001','联 想',5000,'c001'); 
insert into products(pid,name,price,category_id) values('p002','海 尔',3000,'c001'); 
insert into products(pid,name,price,category_id) values('p003','雷 神',5000,'c001'); 
insert into products(pid,name,price,category_id) values('p004','JACK JONES',800,'c002'); 
insert into products(pid,name,price,category_id) values('p005','真维 斯',200,'c002'); 
insert into products(pid,name,price,category_id) values('p006','花花公 子',440,'c002');
insert into products(pid,name,price,category_id) values('p007','劲 霸',2000,'c002'); 
insert into products(pid,name,price,category_id) values('p008','香奈 儿',800,'c003'); 
insert into products(pid,name,price,category_id) values('p009','相宜本 草',200,'c003');
insert into products(pid,name,price,category_id) values('p010','梅明 子',200,null);

3.1 综合练习1-【多表查询】

1>查询用户的订单,没有订单的用户不显示

2>查询所有用户的订单详情

3>查询所有订单的用户详情

3.2 综合练习2-【子查询】

1>查看用户为张三的订单详情

2>查询出订单的价格大于300的所有用户信息。

3>查询订单价格大于300的订单信息及相关用户的信息。

3.3 综合练习3-【分页查询】

1>查询所有订单信息,每页显示5条数据

第四章 扩展

4.1 多行新增

insert into 表名(列名) values (列值),(列值),(列值);

4.2 多表更新

(1)update 表1,表2 set 列名=列值 where 表1.列名=表2.列名 and 其他限定条件

(2)update 表1

inner join2 on1.列名=2.列名 
set 列名=列值 
where 限定条件 

示例:

update employee e,salary s 
set title='助工',salary=1000 
where e.empid=s.empid and name='李四' 

4.3 多表删除

语法:

delete 被删除数据的表 from 删除操作中使用的表 
where 限定条件 

注:多张表之间使用逗号间隔

示例:

//删除人事部的信息
delete d,e,s from department d,employee e,salary s 
where d.depid=e.depid and s.empid=e.empid and depname='人事部'

4.4 日期运算函数

now() 获得当前系统时间

year(日期值) 获得日期值中的年份

date_add(日期,interval 计算值 计算的字段);

注:计算值大于0表示往后推日期,小于0表示往前推日期

示例:

date_add(now(),interval -40 year);//40年前的日期 

第五章:数据库优化

  1. 对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引

  2. 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:

    select id from t where num is null

    最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库.

    备注、描述、评论之类的可以设置为 NULL,其他的,最好不要使用NULL。

  3. 应尽量避免在 where 子句中使用 != 或 <> 操作符,否则引擎将放弃使用索引而进行全表扫描。

  4. 应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描,如:

  select id from t where num=10 or Name = 'admin'

可以这样查询:

   select id from t where num = 10 
   union all 
   select id from t where Name = 'admin'
  1. in 和 not in 也要慎用,否则会导致全表扫描,如:

    ​ select id from t where num in(1,2,3)

    对于连续的数值,能用 between 就不要用 in 了:

    ​ select id from t where num between 1 and 3

第五章:数据库优化*

  1. 对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引

  2. 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:

    select id from t where num is null

    最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库.

    备注、描述、评论之类的可以设置为 NULL,其他的,最好不要使用NULL。

  3. 应尽量避免在 where 子句中使用 != 或 <> 操作符,否则引擎将放弃使用索引而进行全表扫描。

  4. 应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描,如:

   select id from t where num=10 or Name = 'admin'

可以这样查询:

select id from t where num = 10 
   union all 
   select id from t where Name = 'admin'
  1. in 和 not in 也要慎用,否则会导致全表扫描,如:

    ​ select id from t where num in(1,2,3)

    对于连续的数值,能用 between 就不要用 in 了:

    ​ select id from t where num between 1 and 3

    很多时候用 exists 代替 in 是一个好的选择

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值