1-3数据模型
tags:数据库
概念
数据模型是对现实世界中相关实体数据特征的抽象也就是说数据模型是用来描述数据、组织数据和对数据进行操作的。数据模型包括两类:一类是概念模型;一类是逻辑模型和物理模型。数据模型是严格定义的一组概念集合,这些概念精确地描述了系统的静态特性、动态特性和完整性约束条件。数据模型通常由数据结构、数据操作、数据的完整性约束条件三部分组成。
数据模型的三方面要求
要求
1. 能比较真实地模拟现实世界
2. 容易为人所理解
3. 便于在计算机上实现
概念模型
概念
概念模型也成为信息模型,他是按照用户的观点来对数据和信息建模,主要用于数据库设计。概念模型独立于特定逻辑模型的数据库存在,如相同概念模型可以在关系型数据库或者面向对象数据库中进行实现
概念模型层次名词解释
实体
客观存在并可以相互区分的事物叫实体。
实体型
具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类####实体,称为实体型。
实体集
同型实体的集合称为实体集。属性:实体所具有的某一特性,一个实体可由若干个属性来刻画。
码
惟一标识实体的属性集称为码。
实体联系图( E 一 R 图)
提供了表示实体型、属性和联系的方法: 实体型:用矩形表示,矩形框内写明实体名
属性
用椭圆形表示,并用无向边将其与相应的实体连接起来; • 联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型( 1 : 1 , 1 : n 或 m : n)
逻辑模型
概念
按照计算机系统的观点对数据建模,主要用于数据库管理系统的实现。
主要包含的模型
模型:
1. 层次模型
2. 网状模型
3. 关系模型
4. 面向对象数据模型
5. 对象关系数据模型
6. 半结构化数据模型
物理模型
概念
物理模型是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方法,或在磁盘或者磁带上的存储方式存取方法是面向计算机系统的。物理模型具体实现是数据库管理系统的任务,数据库设计人员要了解和选择物理模型。
概念模型、逻辑模型、物理模型的关系
——–抽象—–信息世界———->机器世界
现实世界——–>概念模型———->数据库管理系统(特定逻辑与物理模型)从现实世界到概念模型的转换是由数据库设计人员完成的;从概念模型到逻辑模型的转换可以由数据库设计人员完成,也可以用数据库设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要是由数据库管理系统完成的。
关系模型
概念
在用户观点下,由一组关系组成,每个关系的数据结构是一张二维表,它由行和列组成。关系数据库是在一个给定的应用领域,所有的实体及实体之间的联系的关系的集合。1970年IBM公司的E.F.Codd首次提出了数据库系统的关系模型。
基本关系的性质
- 列是同质的。每一列中的分量是同一类型的数据,来自同一个域
- 不同的列可以出自同一个域,称其中每一列为一个属性,不同的属性要给予不同的属性名。
- 列的顺序可以任意交换
- 行的顺序可以任意交换
- 任意两个元组的候选码不能取相同值
- 分量必须取原子值,即每一个分量必须是不可分的数据项
关系模型的数据结构
在用户观点下,由一组关系组成,每个关系的数据结构是一张二维表,它由行和列组成。
集合论角度给出关系数据结构的形式化定义:
1. 域的概念:域是一组具有相同数据类型的值的集合。
2. 笛卡尔积:不再赘述
域的笛卡尔积的子集叫做在这些域上的关系
。
关系模型的操作
查询、插入、删除和修改。查询操作可分为选择,投影,链接,除,并,差,交,笛卡尔积等,其中选择,投影,并,差,笛卡尔积是五中基本操作。
关系模型数据完整性
为了防止数据库中存在不符合语义的数据,即防止数据库中出现不正确的数据,保证数据的正确、有效和相容。
数据库的完整性约束条件:指数据库中的数据应该满足的语义约束条件。
1. 实体完整性:通过基本表中定义主码实现。若属性(指一个或一组属性)A是基本关系R的主属性,则A不能空。
1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界中的一个实体集
2)现实世界中的实体是可以区分的,即它们具有某种唯一性标识
3)相应的,关系模型中的主码作为唯一性标志
4)主码中的属性即主属性,不能取空值。
2. 参照完整性:通过基本表中定义外码实现,即定义外码与主码之间的引用规则。还应定义外码列是否允许空值。若属性(或属性组)F是基本关系R的外码,则或者取空值,或者等于S中某个元组的主码值。
3. 用户定义的完整性:在创建基本表时定义。针对某一具体关系数据库的约束条件。
1)列值非空(NOT NULL)
2)列值唯一(UNIQUE)
3)检查列值是否满足一个布尔表达式(CHECK)
关系模型相关名词解释
- 关系:一个关系对应通常说的一张表;
- 属性:表中的一列即为一个属性;
- 域:属性的取值范围;
- 元组:表中的一行即为一个元组;
- 主码:表中的某个属性组,它可以惟一确定一个元组;
- 分量:元组中的一个属性值;
- 候选码:若关系中的某一属性组的值能唯一地标识一个元组,而其子集不能,则称该属性为候选码。
- 候选码的诸属性成为主属性,不包含在任何候选码中的属性成为非主属性。
- 全码:所有属性都是包含在候选码中。
关系模型的优缺点
优点:
1. 关系模型与格式化模型不同,它是严格建立在数学概念的基础上的。
2. 关系模型的概念单一。
3. 关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发工作。缺点
1. 存取路径对用户隐蔽,查询效率往往较低。
2. 为了提高性能,数据库管理系统必须对用户的查询请求进行优化,因此增加了数据库管理系统的难度。