主键的选择
代理主键
与业务无关,无意义的数字序列
自然主键
事物属性中的自然唯一标识
推荐使用代理主键
- 他们不与业务耦合,因此更易于维护
- 一个大多数表,最好是全部表,通用的键策略能够减少需要编写的源码数量,减少系统的总体拥有成本
字符集的选择
- 纯拉丁字符能表示的内容,没必要选择 Latin1之外的其他字符编码,因为这会节省大量的存储空间
- 如果我们可以确定不需要存放多种语言,就没必要非得使用UTF-8或者其他UNICODE字符类型,这会造成大量的存储空间浪费
- MYSQL的数据类型可以精确到字段,所以当我们需要大型数据库中存放多字节数据的时候,可以通过对不同表不同字段使用不同的数据类型来较大程度较少数据存储量,进而降低IO操作次数并提高缓存命中率
存储引擎的选择
适当的数据冗余
- 被频繁引用只能通过Join 2张(或者更多)打表的方式才能得到的独立小字段
- 这样的场景由于每次join 仅仅只是为了取得某个小字段的值,join到的记录又大,会造成大大量不必要的IO,完全可以通过空间换区时间的方式来优化,不过,冗余的同时需要确保数据的一致性不会遭到破坏,确保更新冗余字段也被更新
适当拆分
当我们的表存在类似于TEXT或者是很大的VARCHAR类型的大字段的时候,如果我们大部分访问这张表的时候都不需要这个字段,我们就该义无反顾的将其拆分到另外独立的表中,以减少常用数据占用的存储空间,这样做的一个明显的好处就是每个数据块中可以存储的数据条数可以大大增加,既减少物理IO次数,也能大大提高内存中的缓存命中率