MySQL开发02-数据库设计_mysql物理设计-CSDN博客

本文链接：https://blog.csdn.net/oddrock/article/details/130027931

文章介绍了MySQL数据库设计的过程，包括逻辑设计的ER模型创建和表映射，以及物理设计的事务分析、文件组织方式选择、索引策略和反范式设计。重点讨论了何时建索引和不建索引的场景，并强调了对关键表的详细说明在设计中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、数据库设计概述

MySQL数据库设计分为逻辑设计和物理设计两个步骤。

数据库逻辑设计分为设计ER模型和将ER模型映射为表两个步骤。

数据库设计人员将根据需求文档，创建与数据库相关的那部分实体关系图（ERD）/类图。这些图形和需求文档相结合，将有助于相关人员更好地理解业务逻辑和实际的表设计。互联网的一些应用往往比较简单，所以经验丰富的研发人员直接设计数据表也是很常见的情况，但是对于复杂的项目，仍然推荐绘制E-R图。
设计ER模型的步骤如下：
1. 标识实体和关系：此步骤主要是标识实体及实体之间的关系。
  1. 标识实体的方法，研究用户需求说明书里的名词或名词短语：例如员工管理系统里的员工、部门。在线考试系统里的课程、试卷、学员。从用户提供的需求说明中得到的一组实体可能不是唯一的。然而，分析过程的不断迭代必定会引导你选择对完成系统需求来说足够用的实体。
  2. 标识关系的方法，也研究需求说明书里的动词或动词短语：大多数情况下，关系都是二元的，例如，员工实体属于某个公司，试卷实体属于某个课程，学员（实体）解答某张试卷（实体）。
2. 标识实体和关系中的属性、主键等信息：比如学员实体包括的属性可能有学员号、姓名、性别、生日等信息。
3. 检查是否满足需求：在确定好实体后，我们再检查实体模型是否能够满足的我们的需求。

这个步骤的主要目的是为步骤1建立的ER模型产生表的描述。这组表应该代表逻辑数据模型中的实体、关系、属性和约束。产生表的描述后，需要检查表是否满足用户的需求和业务规则。

物理数据库设计用于确定逻辑设计如何在目标关系数据库中物理地实现，和特定的DBMS有关。它描述了基本表、文件组织、用户高效访问数据的索引、相关的完整性约束及安全性限制。步骤如下：

选择文件组织方式是指选择表数据的存放方式，以有效的方式存储数据。如果目标DBMS允许，则可以为每个表选择一个最佳的文件组织方式。
对于MySQL来说，选择文件组织方式，基本上等同于选择主键，因为MySQL主键采用聚簇索引。
一般选择以下列作为聚簇索引：
- 经常用于连接操作的列，因为这样会使连接更有效率。
- 在表中经常按某列的顺序访问记录的列。
- 自增主键在一般情况下也会工作得很好。

设计索引需要平衡性能的提升和维护的成本。

MySQL对于多表连接的支持比较差，也就是优化器比较简单，往往为了性能，我们需要考虑一些反规范化的设计。反范式增加了维护数据一致性的成本，因此需要谨慎实施。包括但不限于如下几点：

合并表；
冗余列：减少连接；
引入重复组：例如，某公司有5个电话号码，我们不必使用额外的电话表，而是增加5个列telNO1、telNO2、telNO3、telNO4、telNO5（此种情况一般用于重复组的项的数量不多且不易变化）。
创建统计表；
水平/垂直分区；

表的详细说明只要针对最重要、最关键的表做即可，模板见左图；
主要的说明项包括：
- 记录数：可补充说明未来半年、1年或2年的记录数。
- 增长量：单位时间的数据增长量。如果量大可以按每天；如果量不大则可以按每月。
- 表字段的区分度：主要是考虑到将来在此字段上建立索引类型选择时作参考，当字段值唯一时可以不考虑；当字段值不唯一时，估算一个区别度，近似即可。例如：如果一个表的NAME字段共有2000个值，其中有1999个不同的值，那么1999/2000=0.99越接近1区别度则越高，反之区别度就越低。
- 表的并发：根据具体的业务需求预测表的并发访问，或者说明高峰期的并发程度。

数据库设计分为逻辑设计和物理设计两个大的步骤。
数据库逻辑设计首先是要根据需求中的名词识别出实体、根据需求中的动词识别出关系，从而建立ER模型，然后根据ER模型设计逻辑表。
数据库物理设计先逻辑表的字段转为物理表的字段，然后对两类关键表（数据量大的表、业务关键表）进行事务分析，确定其运行频率、高峰时间和记录数，分析SQL语句细节（查询条件列、排序列、分组列、事务更新列），根据对事务的分析选择主键、二级索引的创建策略，确定是否要做一定的反范式设计，最终给出关键表的详细说明（记录数、增长量、并发量、表字段的区分度、索引建立等）。注意只能对关键表做事务分析和详细说明。
对于数据量小的表、查询总是需要类似全表扫描的表都不建议建立索引。