1.三级模式,两级映射
内模式:与物理层次数据库直接关联,负责如何去存储数据,如何去优化它。物理级数据库。
概念模式:数据库中的表对应着概念模式,表之间会有相应的关联。概念级数据库。
外模式:对应着数据库中的视图,更加灵活的调用数据。用户级数据库。
映射:内模式-概念模式,概念模式-外模式。
2.数据库的设计:
(1)需求分析:分析当前和未来应用的数据要求。包括数据流图,数据字典,需求说明书。
(2)概念设计:设计ER模型,
(3)逻辑设计:ER模型转变成关系模式,运用到关系化理论和转化规则。
(4)物理设计:关系模式结合DBMS运用进来,结合完整性约束等。
3.ER模型:
对于一个较大的数据库,先设计局部ER图,最后把局部ER图集成为总体ER图。
集成的方式有两种,一种为逐个累加集成,一种为多个ER图一次集成。
4.关系模式:
(1)1:1的实体集可以转换为两个或三个关系模式,两个关系模式即实体集之间的联系加入到任意一个实体集的属性中。三个关系模式即每个实体集转换成一个单独的关系模式,实体集之间的联系转换成一个单独的关系模式。
(2)1:N的实体集也可以转换成两个或三个关系模式,两个关系模式即实体集之间的联系必须加到N端的实体集属性中。三个关系模式即每个实体集转换成一个单独的关系模式,实体集之间的联系转换成一个单独的关系模式。
(3)N:M的实体集必须转换成三个关系模式,三个关系模式即每个实体集转换成一个单独的关系模式,实体集之间的联系转换成一个单独的关系模式。
5.关系代数:
(1)笛卡尔积:所求出来的属性数代表两个表的属性数之和,行数代表两个表的行数之积。
(2)投影的是属性,即列。
(3)选择的是行,即一行数据。
(4)自然连接
6.函数依赖:
部分函数依赖:主键是两个属性的组合键,
传递函数依赖:A-B-C,A确定B,B确定C,即A可以确定C,但BC不能反推确定A。
7.规范化求候选键
8.规范化范式
第一范式:属性值都是不可再分的原子值。
第二范式:每个非主属性完全依赖于主键(即不存在部分依赖,部分依赖即两个或以上的主属性共同推出来的属性)。如果主键只有一个属性值,则一定满足第二范式。优化成第二范式可以把主键与和其相关的属性逐个分出,直到只剩余一个主键和其相关联的属性。
第三范式:没有非主属性传递依赖于主键(即不存在传递依赖,传递依赖即主键推出属性1,属性1推出属性2)优化成第三范式可以把属性1和属性2分出再组成一个表,但属性1仍然与主键也组成一个表。
BCNF范式:
即没有非主属性,全部为主属性。
9.关系模式的分解
(1)保持函数依赖的分解,可以不保存数据数据冗余的函数依赖。
(2)无损分解。
10.并发控制
事务4大特性:
(1)原子性:把事务看成一个原子,要么全部做,要么全部不做。
(2)一致性:数据执行前后保持一致的状态。
(3)隔离性:事务之间是独立进行的互不影响。
(4)持续性:事务执行之后,它的影响是持续的。
12.封锁协议
13.数据库完整性约束
实体完整性:对应主键
参照完整性:对应外键
用户自定义完整性:对应自定义范围。
14.数据备份
数据备份分为冷备份和热备份
15.数据仓库和数据挖掘
数据仓库:面向主题,集成的,相对稳定的,反应历史变化的。
从多个数据库中获取数据并存取到数据仓库中,数据仓库不再更改数据,多进行查询操作。
数据集市:部门级数据仓库,当各个部门级数据仓库完成后,再合并成为企业级数据仓库。
数据挖掘:挖掘人类所不知道事务和特性,可以应用于商业领域。