目录
3、数据库管理系统(Database Management System )
一、数据库系统四个概念
1、数据(Data)
数据是数据库中存储的基本对象,它是描述事物的符号记录。
数据的种类:文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等
数据的特点:数据与其语义是不可分的
2、数据库(Database)
数据库(Database,简称 DB )是长期储存
在计算机内
、有组织
、可共享
的大量数据
的集合。
数据库的特点:
- 数据按一定的数据模型组织、描述和储存
- 可为各种用户共享
- 具有最小冗余度
- 数据独立性较高
- 易扩展
3、数据库管理系统(Database Management System )
数据库管理系统(Database management system ,简称 DBMS),是位于用户和操作系统之间的一层数据管理软件,是一个大型复杂的软件系统,是计算机中的基础软件。它主要用于科学地组织和存储数据、高效地获取和维护数据。
数据库管理系统的主要功能:
- 数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象
- 数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率
- 数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改)
- 数据库的事务管理和运行管理
数据库在建立、运行和维护时由DBMS统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复
- 数据库的建立和维护功能(实用程序)
数据库初始数据装载转换
数据库转储
介质故障恢复
数据库的重组织
性能监视分析等
- 其它功能
DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作
4、数据库系统(Database System)
数据库系统(database system, 简称 DBS),主要是由数据库、数据库管理系统(及其开发工具)、数据库管理员以及应用程序所构成的一套人机系统。
数据库系统的特点:
1) 数据结构化(与文件系统的本质区别)
2) 共享性高,冗余度低且易扩展
3) 数据独立性高(独立性指应用程序与逻辑结构、物理存储相互独立)
物理独立性
指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。
逻辑独立性
指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。
- 数据独立性是由DBMS的二级映像功能来保证的
4) 数据统一管理和控制
- 数据的安全性(Security)保护·
保护数据,以防止不合法的使用造成的数据的泄密和破坏。
- 数据的完整性(Integrity)检查
将数据控制在有效的范围内,或保证数据之间满足一定的关系。
- 并发(Concurrency)控制
对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
- 数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。
二、数据模型
在数据库中用数据模型这个工具来抽象、表示和处理
现实世界中的数据和信息。
1)数据模型分类:
- 概念模型( 也称 信息模型)
它是按用户的观点来对数据和信息建模,用于数据库设计。
- 逻辑模型和物理模型
逻辑模型主要包括网状模型、层次模型、关系模型、面向对象模型等,按计算机系统的观点对数据建模,用于DBMS实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
2)数据模型建立过程
1、数据模型的组成
1)数据结构
描述数据库的组成对象,以及对象之间的联系,它是对系统静态特性的描述。
包括两个方面:
(1)数据本身:类型、内容、性质。例如关系模型中的域、属性、关系等。
(2)数据之间的联系:数据之间是如何相互关联的,例如关系模型中的主码、外码联系等。
2) 数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则,它是对系统动态特性的描述。
数据操作的类型:
(1)查询 (select)
(2)更新(包括插入 insert 、删除、修改 alter)
3) 数据完整性约束条件
是一组完整性规则的集合,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。
完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则。
2、常见的数据模型
- 层次模型(Hierarchical Model)
- 网状模型(Network Model)
- 关系模型(Relational Model))
- 面向对象数据模型(Object Oriented Data Model)
- 对象关系数据模型(Object Relational Data Model)
- 半结构化数据模型(Semistruture Data Model)
3、概念模型
1)概念模型的表示
实体-联系方法,用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。
2)信息世界中的基本概念
- 实体(Entity)
客观存在并可相互区别的事物称为实体。
- 属性(Attribute)
实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。例如学生实体可以由学号、姓名、性别、出生年份、系、入学时间等属性组成。(94002268,张山,男,1976,计算机系,1994)这些属性组合起来表征了一个学生。
- 码(Key)
唯一标识实体的属性集称为码。例如学号是学生实体的码。
- 域(Domain)
属性的取值范围称为该属性的域。例如,学号的域为8位整数,姓名的域为字符串集合,年龄的域为小于38的整数,性别的域为(男,女)。
- 实体型(Entity Type)
具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。例如,学生(学号,姓名,性别,出生年份,系,入学时间)就是一个实体型。
- 实体集(Entity Set)
同型实体的集合称为实体集。例如,全体学生就是一个实体集。
- 联系(Relationship)
在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系。实体内部的联系通常是指组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。
3)两个实体型之间的联系
- 一对一联系(1 : 1)
如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1 : 1。例如,学校里面,一个班级只有一个正班长,而一个班长只在一个班中任职,则班级与班长之间具有一对一联系。
- 一对多联系(1 : n)
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1 : n。例如,一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。
- 多对多联系(m : n)
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体集B具有多对多联系,记为m : n。
4、层次模型
层次数据模型是用树状层次结构来组织数据的数据模型。
层次模型满足下面两个条件:
- 有且只有一个结点没有双亲结点,这个结点称为根结点。
- 根以外的其它结点有且只有一个双亲结点。
特点:
- 结点的双亲是唯一的。
- 只能直接处理一对多的实体联系。
- 每个记录类型可以定义一个排序字段,也称为码字段。
- 任何记录值只有按其路径查看时,才能显出它的全部意义。
- 没有一个子女记录值能够脱离双亲记录值而独立存在。
优缺点:
优点
- 层次模型的数据结构比较简单清晰。
- 查询效率高,性能优于关系模型,不低于网状模型。
- 层次数据模型提供了良好的完整性支持。
缺点
- 结点之间的多对多联系表示不自然。
- 对插入和删除操作的限制多,应用程序的编写比较复杂。
- 查询子女结点必须通过双亲结点。
- 层次命令趋于程序化。
5、网状模型
用有向图表示实体和实体之间的联系的数据结构模型称为网状数据模型。
网状数据模型满足下面两个条件:
- 允许一个以上的结点无双亲。
- 一个结点可以有多于一个的双亲。
优缺点:
优点
- 能够更为直接地描述现实世界,如一个结点可以有多个双亲。
- 具有良好的性能,存取效率较高。
缺点
- 结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握。
- DDL、DML语言复杂,用户不容易使用。
- 记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节。
6、关系模型
使用表格表示实体和实体之间关系的数据模型称之为关系数据模型。
关系型数据库是目前最流行的数据库,同时也是被普遍使用的数据库,如MySQL就是一种流行的数据库。
特点:
- 关系数据模型中,无论是是实体、还是实体之间的联系都是被映射成统一的关系—一张二维表,在关系模型中,操作的对象和结果都是一张二维表,它由行和列组成。
- 关系型数据库可用于表示实体之间的多对多的关系
- 关系必须是规范化的关系,即每个属性是不可分割的实体,不允许表中表的存在。
优缺点:
- 优点
- 建立在严格的数学概念的基础上。
- 概念单一。
- 关系模型的存取路径对用户透明。
- 缺点
- 存取路径对用户透明,查询效率往往不如格式化数据模型。
- 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。
三、数据库系统的三级模式
-
模式(Schema)
模式(也称逻辑模式),数据库中全体数据的逻辑结构和特征的描述。
所有用户的公共数据视图。
-
外模式(External Schema)
外模式(也称子模式或用户模式),数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述。
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
-
内模式(Internal Schema)
内模式(也称存储模式),是数据物理结构和存储方式的描述。
- 数据在数据库内部的表示方式。
- 记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)。
- 索引的组织方式。
- 数据是否压缩存储。
- 数据是否加密。
- 数据存储记录结构的规定。
三级模式结构图
数据库系统的二级映像功能
三级模式是对数据的三个抽象级别,二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换:
- 外模式/模式映像(保证数据的逻辑独立性。)
(1)当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变。
(2)应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
- 模式/内模式映像(保证数据的物理独立性)
(1)当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。
(2)应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。
数据库的二级映像的主要功能:保证了数据库外模式的稳定性。从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改。
参考:https://blog.csdn.net/weixin_43914604/article/details/105071566