- 第一范式
- 第二范式
- 第三范式
第三范式(Third Normal Form,3rd NF)就是指表中的所有数据元素不但要能惟一地被主关键字所标识,而且它们之间还必须相互独立,不存在其他的函数关系。也就是说,对于一个满足2nd NF 的数据结构来说,表中有可能存在某些数据元素依赖于其他非关键字数据元素的现象,必须消除。
--------------------------------------------------------------------------------------------------
范式:
第一范式:数据库表的字段都是单一属性,不可再分。
第二范式:数据库表中不存在非关键字段对任一候选关键字段的部分函数依赖。
(部分函数依赖指的是存在组合关键字中的某些字段决定非关键字段的情况)。即要求所有属性都依赖于主键。
第三范式:数据库表中不存在非关键字段对任一候选关键字段的传递函数依赖。
范式是向下兼容的。
例如:
学生ID
学生名称
学生部门
课程ID
课程名称
成绩
60100
张三
教育学院,心理系,1班
English_1
英语1
80
1)违反第一范式。因为:学生部门可以分解为:学院,系,班级
2)违反第二范式。因为:关键字段是学生ID和课程ID, 但存在“课程ID”决定课程名称和课程学分。
3)违反第三范式。因为:关键字段是学生ID,但存在可能名称和学分依赖“课程ID”。
--------------------------------------------------------------------------------------------------
- E-R模型
实体-联系模型(简称E-R模型)它提供不受任何DBMS约束的面向用户的表达方法,在数据库设计中被广泛用作数据建模的工具。
---------------------------------------------------------------------------------------------
电信行业的数据仓库都采用了分层设计原则。
总的来说,分三层:接口层、中间汇总层和应用层。
特别强调的是:
中间层是数据仓库最重要的一层。直接决定了数据仓库的性能。
一般的做法是:
1)数据汇总。将底层数据按维度进行小颗粒度汇总
2)信息聚合。将多张表的信息聚合在一个表中。这样的好处,是避免使用表关联,提高查询性能。