数据库设计 5 步骤
1. 确定 entities 及 relationships
a) 设计宏观行为。你用此数据库来做什么?比如,希望管理雇员的信息。
b) 确定 entities 。对于一系列的行为,确定所管理信息所涉及到的主题范围。这将变成 table 。比如,雇用员工,指定具体部门,确定技能等级。
c) 确定 relationships 。看着行为,确定 tables 之间有何种关系。比如,在部门与雇员之间存在一种关系。给这种关系命名。
d) 细化行为。你从宏观行为开始,现在仔细检查这些行为,看有哪些行为能转为微观行为。比如,管理雇员的信息可细化为:
● 增加新员工
● 修改存在员工信息
● 删除调走的员工
e) 确定业务规则。看着你的业务规则,确定你要采取哪种。比如,可能有这样一种规则,一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。
范例:
ACME 是一个小公司,在 5 个地方都设有办事处。当前,有 75 名员工。公司准备快速扩大规模,划分了 9 个部门,每个部门都有其领导。
为有助于寻求新的员工,人事部门规划了 68 种技能,为将来人事管理作好准备。员工被招进时,每一种技能的专业等级都被确定。
定义宏观行为
一些 ACME 公司的宏观行为包括:
● 招聘员工
● 解雇员工
● 管理员工个人信息
● 管理公司所需的技能信息
● 管理哪位员工有哪些技能
● 管理部门信息
● 管理办事处信息
确定 entities 及 relationships
我们可以确定要存放信息的主题领域 ( 表 ) 及其关系,并创建一个基于宏观行为及描述的图表。
我们用方框来代表 table ,用菱形代表 relationship 。我们可以确定哪些 relationship 是一对多,一对一,及多对多。
这是一个 E-R 草图,以后会细化。
细化宏观行为
以下微观行为基于上面宏观行为而形成:
● 增加或删除一个员工
● 增加或删除一个办事处
● 列出一个部门中的所有员工
● 增加一项技能
● 增加一个员工的一项技能
● 确定一个员工的技能
● 确定一个员工每项技能的等级
● 确定所有拥有相同等级的某项技能的员工
● 修改员工的技能等级
这些微观行为可用来确定需要哪些 table 或 relationship 。
确定业务规则
业务规则常用于确定一对多,一对一,及多对多关系。
相关的业务规则可能有:
● 现在有 5 个办事处;最多允许扩展到 10 个。
● 员工可以改变部门或办事处
● 每个部门有一个部门领导
● 每个办事处至多有 3 个电话号码
● 每个电话号码有一个或多个扩展
● 员工被招进时,每一种技能的专业等级都被确定。
● 每位员工拥有 3 到 20 个技能
● 某位员工可能被安排在一个办事处,也可能不安排办事处。
2. 确定所需数据
要确定所需数据:
1. 确定支持数据
2. 列出所要跟踪的所有数据。描述 table( 主题 ) 的数据回答这些问题:谁,什么,哪里,何时,以及为什么
3. 为每个 table 建立数据
4. 列出每个 table 目前看起来合适的可用数据
5. 为每个 relationship 设置数据
6. 如果有,为每个 relationship 列出适用的数据
确定支持数据
你所确定的支持数据将会成为 table 中的字段名。比如,下列数据将适用于表 Employee ,表 Skill ,表 Expert In 。
如果将这些数据画成图表,就像:
需要注意:
● 在确定支持数据时,请一定要参考你之前所确定的宏观行为,以清楚如何利用这些数据。
● 比如,如果你知道你需要所有员工的按姓氏排序的列表,确保你将支持数据分解为名字与姓氏,这比简单地提供一个名字会更好。
● 你所选择的名称最好保持一致性。这将更易于维护数据库,也更易于阅读所输出的报表。
● 比如,如果你在某些地方用了一个缩写名称 Emp_status ,你就不应该在另外一个地方使用全名 (Empolyee_ID) 。相反,这些名称应当是 Emp_status 及 Emp_id 。
● 数据是否与正确的 table 相对应无关紧要,你可以根据自己的喜好来定。在下节中,你会通过测试对此作出判断。
3. 标准化数据
标准化是你用以消除数据冗余及确保数据与正确的 table 或 relationship 相关联的一系列测试。共有 5 个测试。本节中,我们将讨论经常使用的 3 个。
关于标准化测试的更多信息,请参考有关数据库设计的书籍。
标准化格式
标准化格式是标准化数据的常用测试方式。你的数据通过第一遍测试后,就被认为是达到第一标准化格式;通过第二遍测试,达到第二标准化格式;通过第三遍测试,达到第三标准化格式。
如何标准格式:
1 . 列出数据
2 . 为每个表确定至少一个键。每个表必须有一个主键。
3 . 确定 relationships 的键。 relationships 的键是连接两个表的键。
4 . 检查支持数据列表中的计算数据。计算数据通常不保存在数据库中。
5 . 将数据放在第一遍的标准化格式中:
6 . 从 tables 及 relationships 除去重复的数据。
7 . 以你所除去数据创建一个或更多的 tables 及 relationships 。
8 . 将数据放在第二遍的标准化格式中:
9 . 用多于一个以上的键确定 tables 及 relationships 。
10 . 除去只依赖于键一部分的数据。
11 . 以你所除去数据创建一个或更多的 tables 及 relationships 。
12 . 将数据放在第三遍的标准化格式中:
13 . 除去那些依赖于 tables 或 relationships 中其他数据,并且不是键的数据。
14 . 以你所除去数据创建一个或更多的 tables 及 relationships 。
数据与键
在你开始标准化(测试数据)前,简单地列出数据,并为每张表确定一个唯一的主键。这个键可以由一个字段或几个字段(连锁键)组成。
主键是一张表中唯一区分各行的一组字段。 Employee 表的主键是 Employee ID 字段。 Works In relationship 中的主键包括 Office Code 及 Employee ID 字段。给数据库中每一 relationship 给出一个键,从其所连接的每一个 table 中抽取其键产生。
将数据放在第一遍的标准化格式中
● 除去重复的组
● 要测试第一遍标准化格式,除去重复的组,并将它们放进他们各自的一张表中。
● 在下面的例子中, Phone Number 可以重复。(一个工作人员可以有多于一个的电话号码。)将重复的组除去,创建一个名为 Telephone 的新表。在 Telephone 与 Office 创建一个名为 Associated With 的 relationship 。
将数据放在第二遍的标准化格式中
● 除去那些不依赖于整个键的数据。
● 只看那些有一个以上键的 tables 及 relationships 。要测试第二遍标准化格式,除去那些不依赖于整个键的任何数据(组成键的所有字段)。
● 在此例中,原 Employee 表有一个由两个字段组成的键。一些数据不依赖于整个键;例如, department name 只依赖于其中一个键( Department ID )。因此, Department ID ,其他 Employee 数据并不依赖于它,应移至一个名为 Department 的新表中,并为 Employee 及 Department 建立一个名为 Assigned To 的 relationship 。
将数据放在第三遍的标准化格式中
● 除去那些不直接依赖于键的数据。
● 要测试第三遍标准化格式,除去那些不是直接依赖于键,而是依赖于其他数据的数据。
● 在此例中,原 Employee 表有依赖于其键( Employee ID )的数据。然而, office location 及 office phone 依赖于其他字段,即 Office Code 。它们不直接依赖于 Employee ID 键。将这组数据,包括 Office Code ,移至一个名为 Office 的新表中,并为 Employee 及 Office 建立一个名为 Works In 的 relationship 。
4. 考量关系
当你完成标准化进程后,你的设计已经差不多完成了。你所需要做的,就是考量关系。
考量带有数据的关系
你的一些 relationship 可能集含有数据。这经常发生在多对多的关系中。
遇到这种情况,将 relationship 转化为一个 table 。 relationship 的键依旧成为 table 中的键。
考量没有数据的关系
要实现没有数据的关系,你需要定义外部键。外部键是含有另外一个表中主键的一个或多个字段。外部键使你能同时连接多表数据。
有一些基本原则能帮助你决定将这些键放在哪里:
一对多 在一对多关系中, “ 一 ” 中的主键放在 “ 多 ” 中。此例中,外部键放在 Employee 表中。
一对一 在一对一关系中,外部键可以放进任一表中。如果必须要放在某一边,而不能放在另一边,应该放在必须的一边。此例中,外部键( Head ID )在 Department 表中,因为这是必需的。
多对多 在多对多关系中,用两个外部键来创建一个新表。已存的旧表通过这个新表来发生联系。
5. 检验设计
在你完成设计之前,你需要确保它满足你的需要。检查你在一开始时所定义的行为,确认你可以获取行为所需要的所有数据:
● 你能找到一个路径来等到你所需要的所有信息吗?
● 设计是否满足了你的需要?
● 所有需要的数据都可用吗?
如果你对以上的问题都回答是,你已经差不多完成设计了。
最终设计
最终设计看起来就像这样:
设计数据库的表属性
数据库设计需要确定有什么表,每张表有什么字段。此节讨论如何指定各字段的属性。
对于每一字段,你必须决定字段名,数据类型及大小,是否允许 NULL 值,以及你是否希望数据库限制字段中所允许的值。
选择字段名
字段名可以是字母、数字或符号的任意组合。然而,如果字段名包括了字母、数字或下划线、或并不以字母打头,或者它是个关键字(详见关键字表),那么当使用字段名称时,必须用双引号括起来。
为字段选择数据类型
SQL Anywhere 支持的数据类型包括:
整数( int, integer, smallint )
小数( decimal, numeric )
浮点数( float, double )
字符型( char, varchar, long varchar )
二进制数据类型( binary, long binary )
日期 / 时间类型( date, time, timestamp )
用户自定义类型
关于数据类型的内容,请参见 “SQL Anywhere 数据类型 ” 一节。字段的数据类型影响字段的最大尺寸。例如,如果你指定 SMALLINT ,此字段可以容纳 32,767 的整数。 INTEGER 可以容纳 2,147,483,647 的整数。对 CHAR 来讲,字段的最大值必须指定。
长二进制的数据类型可用来在数据库中保存例如图像 ( 如位图 ) 或者文字编辑文档。这些类型的信息通常被称为二进制大型对象,或者 BLOBS 。
关于每一数据类型的完整描述,见 “SQL Anywhere 数据类型 ” 。
NULL 与 NOT NULL
如果一个字段值是必填的,你就将此字段定义为 NOT NULL 。否则,字段值可以为 NULL 值,即可以有空值。 SQL 中的默认值是允许空值;你应该显示地将字段定义为 NOT NULL ,除非你有好理由将其设为允许空值。
关于 NULL 值的完整描述,请见 “NULL value” 。有关其对比用法,见 “Search conditions” 。
选择约束
尽管字段的数据类型限制了能存在字段中的数据(例如,只能存数字或日期),你或许希望更进一步来约束其允许值。
你可以通过指定一个 “CHECK” 约束来限制任意字段的值。你可以使用能在 WHERE 子句中出现的任何有效条件来约束被允许的值,尽管大多数 CHECK 约束使用 BETWEEN 或 IN 条件。
更多信息
有关有效条件的更多信息,见 “Search conditions” 。有关如何为表及字段指定约束,见 “Ensuring Data Integrity” 。
例子
例子数据库中有一个名为 department 的表,字段是 dept_id, dept_name, dept_head_id 。其定义如下:
注意每一字段都被指定为 “not null” 。这种情况下,表中每一记录的所有字段的数据都必填。
选择主键及外部键
主键是唯一识别表中每一项记录的字段。如何你的表已经正确标准化,主键应当成为数据库设计的一部分。
外部键是包含另一表中主键值的一个或一组字段。外部键关系在数据库中建立了一对一及一对多关系。如果你的设计已经正确标准化,外部键应当成为数据库设计的一部分。
http://www.cnblogs.com/MeChecksV/articles/1144073.html