1、数据库基础

一、关系数据模型

1.1 、 数据库基本概念

数据库(Database, DB)
数据库管理系统(Database Management System, DBMS)
数据库管理员( Database Administrator, DBA)

数据库系统( Database System, DBS )


1.2、二维表

每个关系的数据结构 是一张规范化的二维表,也就是说关系数据模型是用二维表的形式来表示实体和实体间联系的数据模型。
关系的逻辑结构是一个二维表。表中的每一列表示关系的一个属性,每列的名字即为一个属性名;每一行表示一个记录,代表一个物理实体。

在关系数据库中,所有的数据都是通 过表来进行存储的,可以说如果没有表,数据就无法进行存储和表示。

关系术语          一般表格的术语
关系名              表格名
关系模式          表头(表格的描述)
关系                (一张)二维表
元组                记录或者行
属性                列
属性名            列名
属性值            列值
分量               一行的记录中的一个列值
非规范关系        表中有表表中嵌套有小表


1.3关系数据模型特点

关系数据模型具有以下特点。
□关系必须规范化指关系模型中的每一个关系模式都必须满足一定的要求。
□模型概念单一这也是关系数据模型的优点。无论实体还是实体之间的联系都用关系来表示。对数据检索和更新的结果也是关系(即表)。所以其数据结构简单、清晰、 易于理解和使用。
□集合操作在关系数据模型中,操作的对象和结果都是元组的集合,即关系。
关系数据模型还具有下列优点。
□关系数据模型与非关系数据模型不同,它是建立在严格的数学概念的基础上的。
□关系数据模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数椐库开发、建立的工作。
□关系数据模型的概念单一。


1.4 、 关系型数据库

Q: 目前都有哪些主流的关系型数据库
A:Oracle Oralce、 、IBM DB2、 、MS SQL /Server、 、SyBase SyBase、 、IBM Informix、 、MySQL 、
Access

Q:XML,TXT  可以做为数据库吗?


1.5 、E-R  模型 (Entry-Relation )
E-R 模型三要素:实体、关系、属性

实体间联系(1:1)(1:n)(n:m)


二、关系数据库

2.1、关系操作

关系操作所操作的对象和结果都是集合,称为一次一集合(Set-at-a-time)的方式。而非 关系数据模型的数据操作方式则为一次一记录(Record-at-a-time)的方式。
关系数据模型中常用的关系操作包括:査询(Query)操作和插入(Insert)、删除(Delete)、 修改(Update)操作两大部分。
关系操作中最重要的是关系査询操作,主要分为:选择(Select)、投影(Project)、连接 (Join)、除(Divide)、并(Union)、差(Except)、交(Intersection)和笛卡尔积等。其中, 选择、投影、并、差、笛卡尔积是5种基本操作。


2.2、关系的完整性

关系模型的完整性是对关系的某种约束条件。关系模型中有三类完整性约束:实体完整性,参照完整性和用于自定义完整性。其中前两种完整性是关系模型必须满足的完整性约束条件,应该由关系系统自动支持。

实体完整性

现实世界中的一个实体集就是一个基本关系。如学生的集合是一个实体,对应学生关系。实体是可区分的,既它们具有某中唯一性标识。在关系模型中用主码作为实体唯一性标识。主码的属性值不能取空值(即不知道或者无意义的值)。

实体完整性规则:如果属性A是基本关系R的主属性,则属性A不能取空值。这里的属性包括基本关系的所有主属性,而不仅仅是主码整体。

、参照完整性

实际的实体之间往往存在某种联系,在关系模型中实体及实体间的联系都是用关系来描述的。这样就自然存在关系与关系间的引用。

【例1】学生实体和专业实体可以用下面的关系表示,其中主码用下划线表示:

学生(学号,姓名,性别,专业,年龄)

专业(专业号,专业名)

可见学生关系引用了专业关系的主码“专业号”,显然,学生关系中的专业号值必须是确实存在的专业的专业号,及专业关系中有该专业的记录。这就是说学生关系中的某个属性的取值需要参照专业关系的属性取值。

【例2】学生、课程、学生与课程之间的多对多联系可以用下述关系来表示:

定义2.5:设F是基本关系R的一个或者一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码,并称基本关系R为参照关系,S为被参照关系。R与S可以是同一关系。

参照完整性:如果属性(组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R与S不一定是不同的关系),则对于R中的每个元组在F上的值必须为:或者取空值(F的每个属性都为空);或者等于S中某个元组的主码值。

【例如】对于例1,学生关系中每个元组的专业号属性只能取下面两类值:

空值,表示尚未为该学生分配专业;

非空值,该值必须是专业关系中某个元组的专业号值,表示学生不可能分配到一个不存在的专业中。读者可自行分析其他的例子。

用户自定义完整性

用户自定义完整性是针对某一具体关系数据库的约束条件,它反映某一具体应用所涉及的数据必须满足的语义要求,例如年龄属性,如果属于某一个学生主体,则可能要求年龄在17岁到25岁之间,而如果年轻属性属于某一个公司员工主体,则可能要求年龄在18岁到40岁之间。不同的应用有着不同的具体要求,这些约束条件就是用户根据需要自己定义的。对于这类完整性,关系模型只提供定义和检验这类完整性的机制,以使用户能够满足自己的需求,而关系模型自身并不去定义任何这类完整性规则。


三、关系数据库规范化理论

一个关系数据库由一组关系模式组成,一个关系由一组属性名组成,关系数据库设计就是如何把已给定的相互关联的一组属性名分组,并把每一组属性名组织成关系的问题。
1、关系规范化的作用
所谓规范化,就是用形式更为简洁、结构更加规范的关系模式取代原有关系的过程。
2、函数依赖
2.1、属性间的联系
实体间的联系有两类:一类是实体与实体之间的联系;另一类是实体内部各属性间的联系。
属性间的联系可分为以下三类:
(1)一对一联系(1∶1)
以职工模式为例:职工(职工号,姓名,职称,部门)。如果该企业(或单位)中职工无重名,则属性职工号与姓名之间是1∶1联系。一个职工号唯一地决定一个姓名,一个姓名也可决定唯一的职工号。
设X、Y是关系R的两个属性(集)。如果对于X中的任一具体值,Y中至多有一个值与之对应,且反之亦然,则称X、Y两属性间是一对一联系。
(2)一对多联系(1∶ m)
在职工模式中,职工号和职称间是一对多联系。一个职工号只对应一种职称(如胡一民只能对应工程师),但一种职称却可对应多个职工号(如工程师可对应多名职工)。
设X、Y是关系R的两个属性(集)。如果对于X中的任一具体值,Y中至多有一个值与之对应,而Y中的一个值却可以和X中的n个值相对应,则称Y对X是一对多联系。
(3)多对多联系(m∶ m)
在职工模式中,职称和部门之间是多对多联系。一种职称可分布在多个部门中(如每一个部门中均可有工程师),而一个部门中也可有多个职称。
设X、Y是关系R的两个属性(集)。如果对于X中的任一具体值,Y中有m个值与之对应,而Y中的一个值也可以和X中的n个值相对应,则称Y对X是多对多联系。
上述属性间的三种联系实际上是属性值之间相互依赖又相互制约的反映,称为属性间的数据依赖。
数据依赖共有三种:函数依赖( FunctionalDependency ,简称 FD )、多值依赖( Multiva-luedDependency ,简称 MVD )和连接依赖( JoinDependency ,简称 JD ),其中最重要的是函数依赖和多值依赖。
2.2、函数依赖
函数依赖是属性之间的一种联系。假设给定一个属性的值,就可以唯一确定(查到)另一个属性的值。
定义:所谓函数依赖是指在关系 R 中, X Y R 的两个属性或属性组,如果对于 R 的任一关系 r 都存在:对于 X 的每一个具体值, Y 都只有一个具体值与之对应,则称属性 Y 函数依赖于属性 X 。或者说,属性 X 函数决定属性 Y ,记作 X à Y 其中X叫决定因素,Y叫被决定因素。当Y是X的子集时,称为平凡函数依赖。由于平凡函数依赖总是成立的,因此,若不作特殊声明,本书后面提到的函数依赖,都不包含平凡函数依赖。
此定义可简单表述为:如果属性X的值决定属性Y的值,那么属性Y函数依赖于属性X。
前面讨论的属性间的三种联系,并不是每一种联系中都存在函数依赖。
(1)如果两属性集X、Y 间是1∶ 1联系,则存在函数依赖:X ß>Y。
(2)如果两属性集X、Y间是m∶ 1联系,则存在函数依赖:X àY。
(3)如果两属性集X、Y间是m∶ n联系,则不存在函数依赖。
2.3、码的定义
定义 K 是关系模式 R U F )中的属性或属性组, K ′是 K 的任一真子集。若 K à U ,而不存在 K à U ,则 K R 的候选码( CandidateKey ),简称为码。
· 若候选码多于一个,则选定其中的一个为主码(PrimaryKey);
· 包含在任一候选码中的属性,叫做主属性(PrimeAttribute);
· 不包含在任何候选码中的属性称为非主属性(NonprimeAttribute)或非码属性(Non KeyAttribute);
· 关系模式中,最简单的情况,单个属性是码,称为单码(SingleKey);最极端的情况,整个属性组是码,称为全码(All Key)。
定义 设有两个关系模式R和S,X是R的属性或属性组,并且X不是R的码,但X是S的码(或与S的码意义相同),则称X是R的外部码(ForeignKey),简称外码。
2.4、函数依赖和码的唯一性
码是由一个或多个属性组成的可唯一标识元组的最小属性组。码在关系中总是唯一的,即码函数决定关系中的其他属性。因此,一个关系中,码值总是唯一的(如果码的值重复,则整个元组都会重复)。否则,违反实体完整性规则。
与码的唯一性不同,在关系中,一个函数依赖的决定因素可能是唯一的,也可能不是唯一的。如果我们知道A决定B,且A和B在同一关系中,但我们仍无法知道A是否能决定除B以外的其他所有属性,所以无法知道A在关系中是否是唯一的。
3、关系模式的规范化
3.1、关系模式的规范化
当一个关系中的所有分量都是不可分的数据项时,该关系是规范化的
关系按其规范化程度从低到高可分为5级范式,分别称为1NF、2NF、3NF(BCNF)、4NF、5NF。规范化程度较高者必是较低者的子集
3.2、第一范式(1NF)
定义 如果关系模式 R 中不包含多值属性,则 R 满足第一范式,简称 1NF FirstNor-malForm ),记作 R 属于 1NF
1NF是规范化的最低要求,不满足1NF的关系是非规范化关系
3.3、第二范式(2NF)
定义 X Y 是关系 R 的两个不同的属性或属性组,且 X 属于 Y 。如果存在 X 的某一个真子集 X ′,使 X ′属于成立,则称 Y 部分函数依赖于 X ,反之,则称 Y 完全函数依赖于 X
定义 如果一个关系 R 属于 1NF ,且它的所有非主属性都完全函数依赖于 R 的任一候选码,则 R 属于第二范式,记作 R 属于 2NF
推论:如果关系模式R‑1NF,且它的每一个候选码都是单码,则R属于2NF。
3.4、第三范式(3NF)
定义 在关系 R 中, X Y Z R 的三个不同的属性或属性组,如果 X à Y Y à Z ,但 Y/-->X Y 不是 X 的子集,则称 Z 传递依赖于 X
定义 如果关系模式 R 属于 2NF ,且它的每一个非主属性都不传递依赖于任何候选码,则称 R 是第三范式,记作 R 属于 3NF
推论1 如果关系模式R属于1NF,且它的每一个非主属性既不部分依赖,也不传递依赖于任何候选码,则R属于3NF。
推论2 不存在非主属性的关系模式一定为3NF。
3.5、改进的3NF——BCNF
定义 设关系模式R(U,F)属于NF,若F的任一函数依赖X àY(Y不是X的子集)中X都包含了R的一个码,则称R属于BCNF。
换言之,在关系模式R中,如果每一个决定因素都包含码,则R属于BCNF。
由BCNF的定义可以得到以下推论:如果R属于BCNF,则
· R中所有非主属性对每一个码都是完全函数依赖;
· R中所有主属性对每一个不包含它的码,都是完全函数依赖;
· R中没有任何属性完全函数依赖于非码的任何一组属性。
定理:如果R属于BCNF,则R属于3NF一定成立。
一个关系模式如果达到了BCNF,那么在函数依赖范围内,它已实现了彻底的分离,消除了数据冗余、插入和删除异常。
4、多值依赖和第四范式
定义 设R(U)是属性集U上的一个关系模式,X、Y、Z是U的子集,且Z=U-X-Y。如果对R(U)的任一关系r,给定一对(x,z)值,都有一组Y值与之对应,这组Y值仅仅决定于x值而与z值无关。称Y多值依赖于X,或X多值决定Y,记作X ààY。
定义中如果Z为空集,则称X ààY为平凡的多值依赖,否则为非平凡多值依赖。
定义 如果关系模式R属于1NF,对于R的每个非平凡的多值依赖X ààY(Y不是X的子集),X含有码,则称R是第四范式,即R属于4NF。
一个关系模式如果属于4NF,则一定属于BCNF,但一个BCNF的关系模式不一定是4NF的,R中所有的非平凡多值依赖实际上是函数依赖。
5、关系的规范化度
关系规范化的目的是解决关系模式中存在的数据冗余、插入和删除异常、更新繁琐等问题。其基本思想是消除数据依赖中的不合适部分,使各关系模式达到某种程度的分离,使一个关系描述一个概念、一个实体或实体间的一种联系。因此,规范化的实质是概念的单一化。
规范化的基本原则是:由低到高,逐步规范,权衡利弊,适可而止。通常,以满足第三范式为基本要求。
把一个非规范化的数据结构转换成第三范式,一般经过以下几步:
(1)把该结构分解成若干个属于第一范式的关系。
(2)对那些存在组合码,且有非主属性部分函数依赖的关系必须继续分解,使所得关系都属于第二范式。
(3)若关系中有非主属性传递依赖于码,则继续分解之,使得关系都属于第三范式。
关系模式的规范化过程是通过投影分解实现的,即用投影运算把一个模式分解成若干个高一级的关系模式。这种投影分解不是唯一的。


四、数据库设计
定义
(Database Design)是指根据用户的需求,在某一具体的数据库管理系统上,设计数据库的结构和建立数据库的过程。数据库系统需要操作系统的支持。
数据库设计是建立数据库及其应用系统的技术,是信息系统开发和建设中的核心技术。由于数据库应用系统的复杂性,为了支持相关程序运行,数据库设计就变得异常复杂,因此最佳设计不可能一蹴而就,而只能是一种“反复探寻,逐步求精”的过程,也就是规划和结构化数据库中的数据对象以及这些数据对象之间关系的过程。

数据库建设是硬件、软件和干件的结合
三分技术,七分管理,十二分基础数据
技术与管理的界面称之为“干件”
数据库设计应该与应用系统设计相结合
结构(数据)设计:设计数据库框架或数据库结构
行为(处理)设计:设计应用程序、事务处理等
结构和行为分离的设计
传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策。早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计

信息系统
(1)数据库是信息系统的核心和基础,把信息系统中大量的数据按一定的模型组织起来,提供存储、维护、检索数据的功能,使信息系统可以方便、及时、准确地从数据库中获得所需的信息。
(2)数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在。
(3)数据库设计是信息系统开发和建设的重要组成部分。
(4)数据库设计人员应该具备的技术和知识:
数据库的基本知识和数据库设计技术
计算机科学的基础知识和程序设计的方法和技巧
软件工程的原理和方法
应用领域的知识


设计方法
手工试凑法
设计质量与设计人员的经验和水平有直接关系
缺乏科学理论和工程方法的支持,工程的质量难以保证
数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价
规范设计法
基本思想:过程迭代和逐步求精
典型方法:
(1)新奥尔良(New Orleans)方法:将数据库设计分为四个阶段
S.B.Yao方法:将数据库设计分为五个步骤
I.R.Palmer方法:把数据库设计当成一步接一步的过程
(2)计算机辅助设计
ORACLEDesigner 2000
SYBASEPowerDesigner

步骤
需求分析
调查和分析用户的业务活动和数据的使用情况,弄清所用数据的种类、范围、数量以及它们在业务活动中交流的情况,确定用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约。
需求分析是在用户调查的基础上,通过分析,逐步明确用户对系统的需求,包括数据需求和围绕这些数据的业务处理需求。在需求分析中,通过自顶向下,逐步分解的方法分析系统,分析的结果采用数据流程图(DFD)进行图形化的描述。

概念设计
对用户要求描述的现实世界(可能是一个工厂、一个商场或者一个学校等),通过对其中诸处的分类、聚集和概括,建立抽象的概念数据模型。这个概念模型应反映现实世界各部门的信息结构、信息流动情况、信息间的互相制约关系以及各部门对信息储存、查询和加工的要求等。所建立的模型应避开数据库在计算机上的具体实现细节,用一种抽象的形式表示出来。以扩充的实体—(E-R模型)联系模型方法为例,第一步先明确现实世界各部门所含的各种实体及其属性、实体间的联系以及对信息的制约条件等,从而给出各部门内所用信息的局部描述(在数据库中称为用户的局部视图)。第二步再将前面得到的多个用户的局部视图集成为一个全局视图,即用户要描述的现实世界的概念数据模型。

逻辑设计
主要工作是将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。与此同时,可能还需为各种数据处理应用领域产生相应的逻辑子模式。这一步设计的结果就是所谓“逻辑数据库”。
oa工作流数据库设计
oa工作流数据库设计

物理设计
根据特定数据库管理系统所提供的多种存储结构和存取方法等依赖于具体计算机结构的各项物理设计措施,对具体的应用任务选定最合适的物理存储结构(包括文件类型、索引结构和数据的存放次序与位逻辑等)、存取方法和存取路径等。这一步设计的结果就是所谓“物理数据库”。

验证设计
在上述设计的基础上,收集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。一般,一个大型数据库的设计过程往往需要经过多次循环反复。当设计的某步发现问题时,可能就需要返回到前面去进行修改。因此,在做上述数据库设计时就应考虑到今后修改设计的可能性和方便性。

运行与维护设计
在数据库系统正式投入运行的过程中,必须不断地对其进行调整与修改。
数据库设计步骤
数据库设计步骤
至今,数据库设计的很多工作仍需要人工来做,除了关系型数据库已有一套较完整的数据范式理论可用来部分地指导数据库设计之外,尚缺乏一套完善的数据库设计理论、方法和工具,以实现数据库设计的自动化或交互式的半自动化设计。所以数据库设计今后的研究发展方向是研究数据库设计理论,寻求能够更有效地表达语义关系的数据模型,为各阶段的设计提供自动或半自动的设计工具和集成化的开发环境,使数据库的设计更加工程化、更加规范化和更加方便易行,使得在数据库的设计中充分体现软件工程的先进思想和方法。

形成过程
1.需求分析阶段:综合各个用户的应用需求(数据流程图(DFD)
2.概念设计阶段:形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图)
3.逻辑设计阶段:首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式;然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式
4.物理设计阶段:根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。

设计技巧
设计数据库之前
(需求分析阶段)
1) 理解客户需求,询问用户如何看待未来需求变化。让客户解释其需求,而且随着开发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。
2) 了解企业业务可以在以后的开发阶段节约大量的时间。
3) 重视输入输出。
在定义数据库表和字段需求(输入)时,首先应检查现有的或者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。
举例:假如客户需要一个报表按照邮政编码排序、分段和求和,你要保证其中包括了单独的邮政编码字段而不要把邮政编码糅进地址字段里。
4) 创建数据字典和ER 图表
ER 图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别名。对SQL表达式的文档化来说这是完全必要的。
5) 定义标准的对象命名规范
数据库各种对象的命名必须规范。


表和字段的设计
(数据库逻辑设计)
表设计原则
1) 标准化和规范化
数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简单来说,遵守3NF 标准的数据库的表设计原则是:“One Fact in One Place”即某个表只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。
举例:某个存放客户及其有关定单的3NF数据库就可能有两个表:Customer 和Order。Order 表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向Customer 表里包含该客户信息的那一行。
事实上,为了效率的缘故,对表不进行标准化有时也是必要的。
2) 数据驱动
采用数据驱动而非硬编码的方式,许多策略变更和维护都会方便得多,大大增强系统的灵活性和扩展性。
举例,假如用户界面要访问外部数据源(文件、XML 文档、其他数据库等),不妨把相应的连接和路径信息存储在用户界面支持表里。还有,如果用户界面执行工作流之类的任务(发送邮件、打印信笺、修改记录状态等),那么产生工作流的数据也可以存放在数据库里。角色权限管理也可以通过数据驱动来完成。事实上,如果过程是数据驱动的,你就可以把相当大的责任推给用户,由用户来维护自己的工作流过程。
3) 考虑各种变化
在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。
举例,姓氏就是如此(注意是西方人的姓氏,比如女性结婚后从夫姓等)。所以,在建立系统存储客户信息时,在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就可以跟踪这一数据条目的变化。
4) 每个表中都应该添加的3 个有用的字段
dRecordCreationDate,在VB 下默认是Now(),而在SQL Server  · 下默认为GETDATE()
sRecordCreator,在SQL Server 下默认为NOT NULL DEFAULT  · USER
nRecordVersion,记录的版本标记;有助于准确说明记录中出现null 数据或者丢失数据的原因  ·
5) 对地址和电话采用多个字段
描述街道地址就短短一行记录是不够的。 Address_Line1、Address_Line2 和Address_Line3 可以提供更大的灵活性。还有,电话号码和邮件地址最好拥有自己的数据表,其间具有自身的类型和标记类别。
6) 使用角色实体定义属于某类别的列
在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特定的时间关联关系,从而可以实现自我文档化。
举例:用PERSON 实体和PERSON_TYPE 实体来描述人员。比方说,当John Smith, Engineer 提升为John Smith, Director 乃至最后爬到John Smith, CIO 的高位,而所有你要做的不过是改变两个表PERSON 和PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE 表就包含了所有PERSON 的可能类型,比如Associate、Engineer、Director、CIO 或者CEO 等。还有个替代办法就是改变PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。
7) 选择数字类型和文本类型尽量充足
在SQL 中使用smallint 和tinyint 类型要特别小心。比如,假如想看看月销售总额,总额字段类型是smallint,那么,如果总额超过了$32,767 就不能进行计算操作了。
而ID 类型的文本字段,比如客户ID 或定单号等等都应该设置得比一般想象更大。假设客户ID 为10 位数长。那你应该把数据库表字段的长度设为12 或者13 个字符长。但这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。
8) 增加删除标记字段
在表中包含一个“删除标记”字段,这样就可以把行标记为删除。在关系数据库里不要单独删除某一行;最好采用清除数据程序而且要仔细维护索引整体性。


选择键和索引
(数据库逻辑设计)
键选择原则:
1) 键设计4 原则为
关联字段创建外键。
所有的键都必须唯一。
避免使用复合键。
外键总是关联唯一的键字段。
2) 使用系统生成的主键
设计数据库的时候采用系统生成的键作为主键,那么实际控制了数据库的索引完整性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作为主键还有一个优点:当拥有一致的键结构时,(不让主键具有可更新性)
在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。
4) 可选键有时可做主键
把可选键进一步用做主键,可以拥有建立强大索引的能力。

索引使用原则:
索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索引技术得到解决。
1) 逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。
2) 大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。
3) 不要索引memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。
4) 不要索引常用的小型表
不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。

数据完整性设计
(数据库逻辑设计)
1) 完整性实现机制:
实体完整性:主键
参照完整性:
父表中删除数据:级联删除;受限删除;置空值
父表中插入数据:受限插入;递归插入
父表中更新数据:级联更新;受限更新;置空值
DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机制
用户定义完整性:
NOT NULL;CHECK;触发器
2) 用约束而非商务规则强制数据完整性
采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于商务层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。
3) 强制指示完整性
在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。
4) 使用查找控制数据完整性
控制数据完整性的最佳方式就是限制用户的选择。只要有可能都应该提供给用户一个清晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据特别适合查找:国家代码、状态代码等。
5) 采用视图
为了在数据库和应用程序代码之间提供另一层抽象,可以为应用程序建立专门的视图而不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自由。

其他设计技巧
1) 避免使用触发器
触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你确实需要采用触发器,你最好集中对它文档化。
2) 使用常用英语(或者其他任何语言)而不要使用编码
在创建下拉菜单、列表、报表时最好按照英语名排序。假如需要编码,可以在编码旁附上用户知道的英语。
3) 保存常用信息
让一个表专门存放一般数据库信息非常有用。在这个表里存放数据库当前版本、检查/修复(对 Access)、关联设计文档的名称、客户等信息。这样可以实现一种简单机制跟踪数据库,当客户抱怨他们的数据库没有达到希望的要求而与你联系时,这样做对非客户机/服务器环境特别有用。
4) 包含版本机制
在数据库中引入版本控制机制来确定使用中的数据库的版本。时间一长,用户的需求总是会改变的。最终可能会要求修改数据库结构。把版本信息直接存放到数据库中更为方便。
5) 编制文档
采用给表、列、触发器等加注释的数据库工具。对开发、支持和跟踪修改非常有用。
对数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当过了一年多时间后再回过头来做第2 个版本,犯错的机会将大大减少。
6) 测试、测试、反复测试
建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用户进行测试并且同用户一道保证选择的数据类型满足商业要求。测试需要在把新数据库投入实际服务之前完成。
7) 检查设计
在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。换句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取出数据。




  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值