数据库第二章(数据模型)

(1)三个世界及其关系

现实世界最后能以计算机所能理解和表现的形式反映到数据库中,通常分为3个阶段,称之为现实世界、信息世界、机器世界。

1、现实世界:现实世界就是客观存在的现实世界,它由事物及其相互之间的联系组成。

2、信息世界:信息世界是现实世界在人们头脑中的反映并用文字或符号记载下来,是人们对现实世界的认识抽象过程,经过选择、命名、分类等抽象工作后进入信息世界。

信息世界有如下的基本概念:

1)实体:现实世界中存在的且可区分的事物称为实体,是信息世界的基本单位,例如学生和一个学生选课就是实体。

2)属性:实体所具有的某方面特性,比如学生的学号、姓名、性别等。

3)属性域:是指属性的取值范围,包含值的类型,例如性别的数据类型是字符串,属性域只能取“男”或者“女”。

4)实体型:用实体名及其属性名集合来抽象和刻画同类实体称为实体型。例如,学生(学号、姓名、性别、班号)就是一个实体型。

5)码(也称关键字):码是能唯一标识每个实体的属性集。例如,一个“学号”唯一确定了一个学生,一个学号不能代表两个学生。

3、机器世界:用于计算机管理信息,必须对信息进行数据化,数据化后的信息成为机器世界中的数据,数据是能够被计算机识别、存储并处理的。

机器世界有如下的基本概念:

1)数据项(字段):标记实体属性的命名单位,是数据库中最小的信息单位。例如填写了信息的的小方格就是数据项。

2)记录:字段值的有序集合。例如学号、姓名下方的数据类型一定是一致的,不能把“101”填到姓名里,也不能把“李军填到”学号里去。

3)记录型:字段名的有序集合。

4)文件:同类记录的集合,对应于实体集。

5)码(或关键字):能唯一标识文件中每个记录的字段或字段集。

 

(2)两类模型:在数据库中用数据模型来抽象、表示和处理现实世界中的数据和信息,通俗地讲,数据模型就是现实世界的模拟。

数据模型也能分为两类,第一类是概念模型、第二类是逻辑模型和物理模型。着重掌握的是概念模型。

1、逻辑模型:主要包括网状模型、层次模型、关系模型,是按计算机系统的观点对数据建模,所建立的是属于机器世界的模型。

2、物理模型:对数据最低层的抽象,是面向计算机物理表示的模型,它描述数据在系统内部的方式和存取方法,不仅与具体的DBMS有关,还与操作系统和硬件有关。

3、概念模型:它是按用户的观点来对数据和信息建模,即用于信息世界的建模,所建立的是属于信息世界的模型,主要用于数据库的设计。

(3)实体间的联系方式:在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体内部的联系与实体间的联系。实体内部的联系通常指组成实体的各属性之间的联系。实体时间的联系通常指不同实体集之间的联系。

实体集之间的联系可以分为以下的三类:

1、一对一联系(简记为1:1):对于实体集A中的每一个实体,实体集B中最多有一个(也可以没有)实体与之联系,则称实体集A与实体集B具有1:1联系。

2、一对多联系(简记为1:n):对于实体集A中的每一个实体,实体集B中有n个实体与之联系:反之,对于实体集B中的每一个实体,实体集A最多只有一个与之联系,则称实体集A与实体集B有1:n联系。

3、多对多联系(简记为m:n):如果实体集A中的每一个实体,实体集B中有n个实体与之联系;反之,对于实体集B中的每一个实体,实体集A中也有m个实体与之联系,则称实体集A与实体集B具有多对多联系,记为m:n。

(4):实体-联系表示法(E-R图的画法):在E-R图中,实体用方框表示;联系用菱形表示,并且用边将其与有关的实体连接起来,并在边上标上联系的类型;属性用椭圆表示,并且用边将其与相应的实体连接起来,对于有些联系,其自身也会有某些属性,同实体与属性的连接类似,将联系与其属性连接起来。

1、两个不同实体集之间的画法:

    

 

 2、同一实体集内的二元联系的画法:同一实体集内的二元联系表示其中实体时间的相互联系同样有1:1、1:n和n:m联系。

 (5)设计E-R图的基本步骤

设计E-R图的基本步骤如下:

1)确定系统中包含的实体,用方框框出实体

2)分析每个实体具有的属性名,用椭圆表示出各实体的属性

3)确定实体之间的联系,用菱形表示实体间的联系。

(6)数据模型的的组成要素:数据结构、数据操作、数据的完整性约束条件。下面对这几个要素简单介绍。

数据结构:数据结构是刻画一个数据模型性质最重要的方面,通常按数据组织的类型来命名数据模型。

数据操作:数据操作是对系统动态特性的描述,是数据库中的各种对象的实例(值)允许执行的操作的集合,主要有检索和更新(插入、删除、修改)两类操作。

数据的完整性约束条件:数据的完整性约束条件是一组完整性规则的集合,给出的数据及其联系所具有的制约、依赖和存储规则,用于限定数据库的状态和状态变化,保证数据库中数据的正确、有效、完全和相容。

(7)3种基本的数据类型:目前,成熟地应用在数据库中的数据模型有层次模型、网状模型和关系模型。它们之间的根本区别在于表示方式不同。下面对这三个模型进行简单介绍,着重掌握的是关系模型。

1、层次模型:

1)层次模型的特征:

1。有且仅有一个结点(即根结点),没有双亲结点

2。其他结点有且仅有一个双亲结点

在层次模型中,每一个结点描述一个实体型,称为记录型。一个记录型可有许多记录值,结点之间的有向边表示记录之间的联系,如果要存取某一记录型的记录,就要从根结点开始,按照有向树的层次逐层往下找,查找路径就是存取路径。例如下图的企业-公司-部门-车间的层次模型

 

2)层次模型的数据操作:在层次模型中,数据库的基本操作包括数据记录的查询、插入、删除和修改等。

3)层次模型的完整性约束:层次模型的数据操作需要满足完整性约束条件。

插入:如果没有双亲结点值就不能插入它的孩子结点值。

删除:如果删除双亲结点值,则相应的孩子结点值也被同时删除。

修改:保证数据的一致性。

4)层次模型的存储结构:在层次数据库中不仅要存储数据本身,还要存储数据之间的层次联系,常用的方法有链接法,如层次序列链接法和孩子兄弟链接法。

5)层次模型的优缺点

层次模型的优点如下:

1。数据模型比较简单,操作简单

2。对于实体间的联系是固定的,且预先定义好应用系统,性能极高

3。提供良好的完整性优势。

层次模型的缺点如下:

1。不适合于表示非层次性的联系,使用范围过于单一。

2。对插入和删除操作的限制比较多,当数据很多时,插入或删除的操作往往会对双亲结点产生影响。

3。查询孩子结点必须通过双亲结点,查询方法单一。

4。结构紧密,层次命令只能层层递进,传输效率低下。

2、网状模型

1)网状模型的特征:

1。允许结点有多于一个的双亲结点。

2。可以有一个以上的结点没有双亲结点。

 2)网状模型的数据操作:在网状模型中,数据库的基本操作包括数据记录的查询、插入、删除和修改等,网状模型的数据操作使用的是过程化语言。

3)网状模型的完整性约束条件

1。一个记录型不能在同一个系型中既是主记录型又是属记录型。

2。一个记录不能出现在同一系型的多个系值中。

3。任何一个系值中最多只有一个主记录。

4。插入一个新纪录时,必须遵守插入系籍约束。

5。删除一个记录时,必须遵守删除系籍约束。

4)网状模型的存储结构

在网状模型的存储结构中,关键是如何实现记录之间的联系,常用的方法有链接法。

5)网状模型的优缺点

网状模型的优点如下:

1。更为直接地描述客观世界,可表示实体间的多种复杂联系。

2。具有良好的性能和存储效率。

网状模型的缺点如下:

1。数据结构复杂,导致其DDL语言也极其复杂。

2。数据的独立性差,由于实体间的联系本质上是通过存取路径表示的,因此应用程序在访问数据时要指定存取路径。

3、关系模型

1)关系模型的基本术语:

1。关系:一个关系就是一张表,每个关系有一个关系名。

2。元组:表中的一行即为一个元组,对应存储文件中的一个记录值。例如(101,李军,男,1993/2/20,1003)就是一个元组

3。属性:表中的列称为属性,每一列有一个属性名,属性值相当于记录中的数据项或者字段值,例如“学号”就是一个属性名,“101”就是属性值。

4。域:属性的取值范围,不同元组对同一个属性的值限定的范围。

5。关系模式:对关系的描述称为关系模式,格式如下:

关系名(属性名1,属性名2,.......,属性名n)

6。候选码:是属性或属性组合,其值能够唯一标识一个元组,候选码满足唯一性和最小性。

7。主码:一个关系中可能有多个候选码,从中选出一个作为主码。

8。外码:如果关系R2的一个或一组属性X是另一关系R1的主码,则X称为关系R2的外码,并称关系R2为参照关系,R1为被参照关系。

9。全码:如果关系模型的所有属性都是这个关系模式的候选码,那么就称为全码。

2)关系模型的完整性约束:

1。实体完整性:规定表的每一行在表中是唯一的实体,在关系中,主码值不能为空或部分为空。

2。参照完整性:指两个表的主码和外码的数据应一致。

3。用户定义的完整性:指用户对一具体数值指定的约束条件进行检验。

4。关系模型的存储结构:在关系模型中,实体及实体间的联系都用表来表示,不用像层次或网状那样的链接指针。

5。关系模型的优缺点:

优点如下:

1。与非关系模型不同,关系模型具有较强的数学理论依据。

2。数据结构简单、清晰,用户易懂易用,不仅可用关系描述实体,而且可用关系描述实体间的联系。

3。关系模型的存取路径对用户透明,从而具有更高的数据独立性和更好的安全保密性,也简化了程序员的工作以及数据库的建立与开发工作。

缺点如下:

1。由于存取路径对用户透明,查询效率往往不如非关系模型。

2。关系必须是规范化的关系,即每个属性是不可分的数据项,不允许表中有表。

(8)数据库系统的体系结构

1、数据库系统模式的概念:数据模式是数据库中全体数据的逻辑结构和特征的描述,仅仅涉及型的描述,不涉及具体的值。

2、数据库系统的三级组织结构:概念模式——内模式——外模式

3、3个模式之间的两层映像:外模式/模式映像

模式/内模式映像

4、数据库系统的结构:

1):单用户数据库系统

2):主从式结构的数据库系统

3):分布式结构的数据库系统

4):C/S结构的数据库系统

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值