MySQL学习笔记(一) Schema设计

DATETIME

保存大范围的值，从 1001 年到 9999 年，精度为秒。把日期和时间封装到格式为 YYYYMMDDHHMMSS 的整数中，与时区无关，使用 8 个字节的存储空间。

TIMESTAMP

保存从 1970 年 1 月 1 日午夜以来的秒数，和 UNIX 时间戳相同。TIMESTAMP 只使用 4 个字节的存储空间，范围是从 1970 年到 2038 年。显示的值也依赖于时区

1.2. MySQL Schema 设计中的陷阱

太多的列

MySQL 的存储引擎 API 工作时需要在服务器层和存储引擎层之间通过行缓冲格式拷贝数据，然后在服务器层将缓冲内容解码成各个列。从行缓冲中将解码过的列转换成行数据结构的操作代价是非常高的。 MyISAM 定长行结构正好匹配，不需要转换。MyISAM 的变长行结构和 InnoDB 的行结构则总是需要转换。转换的代价依赖于列的数量。

太多的关联

MySQL 限制了每个关联操作最多只能有 61 张表。一个粗略的经验法则，如果希望查询执行得快速且并发性好，单个查询最好在 12 个表以内做关联。

全能的枚举

注意防止过度使用枚举。修改枚举，就需要 ALTER TABLE

非此发明的 NULL

建议不要存 NULL。但是不要走极端。当确实需要表示未知值时也不要害怕使用 NULL。处理 NULL 确实不容易，但有时候会比它的替代方案更好。

1.3. 范式和反范式

第一范式

符合1NF的关系中的每个属性都不可再分

范式化通常带来的好处：

范式化的更新操作通常比反范式化要快。

当数据较好地范式化时，就只有很少或者没有重复数据，所以只需要修改更少的数据。

范式化的表通常更小，可以更好地存放在内存里，所以执行操作会更快。

很少有多余的数据意味着检索列表数据时，更少需要 DISTINCT 或者 GROUP BY 语句。

范式化设计的 Schema 的缺点是通常需要关联。

反范式的优缺点

反范式化的 Schema 因为所有数据都在一张表中，可以很好地避免关联。

单独的表也能使用更有效的索引策略。

1.4. 缓存表和汇总表

有时提升性能最好的方法是在同一张表中保存衍生的冗余数据；有时也需要创建一张完全独立的汇总表或缓存表。

缓存表表示存储那些可以比较简单地从 Schema 其他表获取数据的表。
汇总表表示保存的是使用 GROUP BY 语句聚合数据的表。

一个有用的技巧是对缓存表使用不同的存储引擎。例如：主表用 InnoDB，使用 MyISAM 作为缓存表的引擎将会得到更小的索引占用空间，并且可以做全文检索。

1.4.1. 物化视图

物化视图是预先计算并且存储在磁盘上的表，可以通过各种各样的策略刷新和更新。MySQL 并不原生支持物化视图。

1.5. 总结

尽量避免过度设计；

使用小而简单的合适数据类型，除非真的需要，否则应尽可能避免使用 NULL；

尽量使用相同的数据类型存储相似或相关的值，尤其是要在关联条件中使用的列；

注意可变长字符串，其在临时表和排序时可能导致悲观的按最大长度分配内存；

尽量使用整型定义标识列；

避免使用 MySQL 已经遗弃的特性，例如指定浮点数的精度，或者整型的显示宽度；

小心使用 ENUM 和 SET；

最好避免使用 BIT。

Peter Pan 1231

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySQL学习笔记(一) Schema设计

MySQL学习笔记(一) Schema设计https://notes.diguage.com/mysqlSchema 设计良好的逻辑设计和物理设计是高性能的基石。1.1. 数据类型的选择更小的通常更好简单就好尽量避免 Null 1.1.1. 整数整数类型： TINYINT 、 SMALLINT 、 MEDIUMINT 、 INT 、 BIGINT；分别使用 8、16、24、32、64 位存储空间。存储的范围从 -2(N-1) 到 2(N-1)-1
复制链接

扫一扫