声明我不是一个数据库工程师,所以日志中一些专注数据库方向的东西不会记录
Schema与数据类型优化
选择优化的数据类型
- 更小的通常更好:因为小数据类型占用磁盘,cpu、内存都更小,所以更小的数据类型一般更快。前提是在保证你要存储的数据,在该类型能允许的范围内。
- 简单就好:简单的数据类型在做操作时会消耗更少的CPU性能。如整数型就比字符型更快。
- 尽量避免null:null时默认值,但是在建立数据表的时候最好设置成 not null 因为null未索引时进行的比较会更加的繁琐也更加的麻烦。
范式和反范式化
-
第一范式(1NF):要求数据库表的每一列都是不可分割的原子数据项
上面的图片时数据库的表的一列数据,观察我们看到,着一列内的数据可以分成两列:户籍和家庭人口,所以不符合第一范式。 -
第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖)
-
第三范式(3NF):在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖)
范式化的优点和缺点
- 范式化的更新操作通常比反范式化更快
- 当数据更好的范式化时,代表数据很少或者没有重复数据,这样操作更加方便
- 范式化的表会更小,占用的空间小,所以操作更加快速。
- 范式化的表很少有多余的数据,代表可以更少的用 group by 和distinck
反范式化的优点和缺点
- 使用反范式化所有数据都在一张表中,所以查询效率更高,因为最次也就时全表检索,可以很好的避免随机I/O。并不是所有的全表检索都是顺序I/O,主要看引擎。