以前看过几次范式,不出意外都忘记了 。今天再来看次
思想:
1,结构数据模型,在组成上分成3部分:数据结构、数据操作和完整性约束。操作就是关系代数,可以看看
2,完整性约束,就是指范式了,它代表一组规则的集合
3,本文简单说下 1NF 2NF 3NF BCNF 4NF。范式的提出,不是为了限制你设计数据库,而是为了减少冗余,方便增删改
4,有时为了追求查询效率,要进行反规范化(就是用空间换时间。以个人经验,数据库设计到3NF,然后有效率问题时候再进行反规范化)
【范式】
----------------------------
1范式:属性不可再分
2范式:满足1,非主属性都依赖于主属性(就是一张表是一个实体,不要多张表混在一张表里)
3范式:满足2,非主属性 不 传递依赖于 主属性
BC范式:符合3NF,并且,主属性不传递依赖于主属性
4范式:每个表至多只有一组 “一对多” 的情况
码:表中可以唯一确定一个元组(一行数据)的某个属性(或者属性组),如果这样的码有不止一个,那么大家都叫 候选码,我们从候选码中挑一个出来做老大,它就叫主码。
主属性:一个属性只要在任何一个候选码中出现过,这个属性就是主属性。
非主属性:与上面相反,没有在任何候选码中出现过,这个属性就是非主属性。
候选码: 若关系中的某一属性或属性组的值能唯一的标识一个元组,而其任何真子集都不能再标识,则称该属性组为(超级码)候选码。
--------------------------------
【反规范化】
(1)增加冗余列。这样做可以减少联表查询,但是不推荐,因为修改数据麻烦,你各个冗余列都得修改到
(2)增加派生列(可以通过其它列得到),比如计算列。这个还是实用的,(有可能)减少查询时候实用case when,这个减少能提升效率
(3)重新组表。如果用户经常用到2表了联合查询,就把2表了联合查询 单独成一个表。这种我没用过
(4)分表。一般是按行分隔,比如按新老数据分隔;按区域数据分隔。分表能减少索引,减少查询的数据行数。数据超过千万就应该分表