范式与反范式
- 第一范式:第一范式 就是 无重复的列, 有唯一标识 ,能够区分不同的行
- 第二范式: 满足第一范式 非主键的列必须完全依赖于主键,而不能仅仅是依赖主键的其中某个列
- 第三范式: 非主键列必须直接依赖主键,不能存在传递依赖。换句话说,就是假设A是主键,那么B,C都是直接依赖A,而不能是C依赖B,B依赖A这种传递依赖方式。
对于任何给定的数据通常都有很多种表示方式,从完全的范式化到完全的反范式化,以及两者的这种。在范式化的数据库中,每个事实数据会出现并且只出现一次。相反,在反范式化的数据库表中,信息是冗余的,可能会存储在多个地方。
范式的优点和缺点。
- 好处
- 范式化的更新操作通常比反范式化要快
- 当数据较好地范式化时,就只有很少或者没有重复的数据,所以只需要修改更少的数据
- 范式化的表通常会更小,可以更好地放在内存里,所以执行操作会更快
- 很少有多余的数据意味着检索列表数据时更少需要DISTINCT或者GROUP BY才能或缺的一份唯一的部门列表。
- 缺点
- 通常需要关联表
- 也可能会使一些索引失效
反范式的优点和缺点
- 好处
- 所有数据都在一张表中,避免关联
混用范式化和反范式化
事实上,完全的范式化和完全的反范式化schema都是实验室里才有的东西。在实际应用中经常需要混用,可能使用部分范式化的shcema、缓存表、以及其他技巧。