1 关系数据库的理解
-
定义的角度:
- 建立在
关系数据库模型
基础上的数据库 - 借助于
集合代数等概念和方法
来处理
数据库中的数据 - 是一个被组织成
一组拥有正式描述性
的表格
,该表格作用的实质是装载着数据项的特殊收集体
。
- 建立在
-
通俗的讲:
- 在一个
给定的应用领域
中,所有实体及实体之间联系的集合
构成一个关系数据库。
- 在一个
-
实现了一些什么样的功能?
- 用户定义的完整性
是对数据表中字段属性的约束
,通常指数据的有效性
,它包括字段的值域
、字段的类型
及字段的有效规则
等约束,它是由确定关系结构时所定义的字段的属性决定的 - 实体完整性
是对关系中的记录唯一性
,也就是主键的约束
。准确地说,实体完整性是指关系中的主属性值不能为Null且不能有相同值
。主键用于唯一标识表中的一条记录 - 参照完整性
对关系数据库中建立关联关系的数据表间数据参照引用的约束
,也就是对外键的约束
。通常通过建立外键联系另一表的主键实现
,还可以用触发器来维护参考完整性
。
- 用户定义的完整性
2 范式
范式:是关系数据库理论的基础
,也是我们在设计数据库结构过程中所要遵循的规则和指导方法
。目前有迹可寻的共有8种范式,依次是:1NF,2NF,3NF,BCNF,4NF,5NF,DKNF,6NF。通常所用到的只是前三个范式,即:第一范式(1NF),第二范式(2NF),第三范式(3NF)。下面就简单介绍下这三个范式。
-
第一范式(1NF,
属性不可拆分 或 无重复的列
):强调的是列的原子性
,即列不能够再分成其他几列
。
考虑这样一个表:【联系人】(姓名,性别,电话)
如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1NF。要符合 1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。 -
第二范式(2NF,
完全函数依赖
):首先是 1NF,另外包含两部分内容,一是表必须有一个主键
;二是非主键列必须完全依赖于主键
,而不能只依赖于主键的一部分
。考虑一个订单明细表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。
因为我们知道在一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合 2NF。不符合 2NF 的设计容易产生冗余数据
。可以把【OrderDetail】表拆分为【OrderDetail】(OrderID,ProductID,Discount,Quantity)和【Product】(ProductID,UnitPrice,ProductName)来消除原订单表中UnitPrice,ProductName多次重复的情况。
-
第三范式(3NF,
消除传递依赖
):首先是 2NF,另外非主键列必须直接依赖于主键
,不能存在传递依赖
。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况
。考虑一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。
其中OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。
通过拆分【Order】为【Order】(OrderID,OrderDate,CustomerID)和【Customer】(CustomerID,CustomerName,CustomerAddr,CustomerCity)从而达到 3NF。 -
修正的第三范式:BCNF是比第三范式更严格一个范式。它要求关系模型中
所有的属性(包括主属性和非主属性)都不传递依赖于任何候选关键字
。也就是说,当关系型表中功能上互相依赖的那些列的每一列都是一个候选关键字时候,该满足BCNF。BCNF实际上是在第三范式的基础上,
进一步消除了主属性的传递依赖
。
第二范式(2NF)和第三范式(3NF)的概念很容易混淆,区分它们的关键点在于
,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是传递依赖于主键。