文章目录
一、数据库系统的概述
1.信息与数据
信息:是数据经过加工处理后得到的另一种形式的数据,这种数据在某种程度上影响接收者的行为。具有客观真实性、传递性、时效性和有用性。
数据(电脑中使用0和1二进制串进行表示):描述事物的符号记录称为数据。
描述事物的符号可以是数字,也可以是文字、图形、图像、音频、视频等,数据有多种表现形式,他们都可以经过数字化后存入计算机。
联系与区别:数据是用以表示信息的符号或载体。信息是经过加工之后并对客观世界和生产活动产生影响的数据,是数据的内涵,是对数据语义的解释。
数据是现象,而信息更反映实质。
2.数据库(DataBase,DB)
1.概念:长期储存在计算机内、有结构的、可共享的大量的数据集合。
3.数据库管理系统(DataBase Management System,DBMS)
1.概念:是位于用户与操作系统之间的一层数据管理软件。和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。
4.数据库系统(DataBase System,DBS)
1.概念:由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DataBase Administrator,DBA)组成的存储、管理、处理和维护数据的系统。
二、数据模型
1.数据模型(data model)也是一种模型,他是对现实世界数据特征的抽象。
2.现有的数据库系统均是基于某种数据模型的,数据模型是数据库系统的核心和基础
3.信息世界的基本概念
1.概念模型
- 概念模型是从现实世界到机器世界的一个中间层次。
- 把现实世界中的客观对象抽象为某种信息结构,这种信息结构不依赖于具体的计算机系统,完全不涉及信息在计算机系统中的结构。
- 强调语义表达能力,概念简单清晰,易于理解,是用户和DB设计人员交流的工具。
- 表示方法——实体联系方法(Entity Relationship Model),该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。
- 实体-联系方法(Entity-Relationship)
实体型——用矩形框表示,实体集名子写在框中。
联系——用菱形框表示,联系名写在框中,用无向边与相关实体集连接,并注明联系类型。
属性——用椭圆表示,属性名写在椭圆中,如果为码属性,其名字带下划线。用无向边将实体集和它的全部属性连接起来。
若联系也有属性,把属性和菱形用无向边连起来
2.数据模型的组成要素
此时数据模型特指逻辑模型
数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成
- 数据结构:描述数据库的组成对象以及对象之间的联系。
- 数据操作:对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。
- 数据的完整性约束条件:一组完整性规则,给定的数据模型中数据及其联系所具有的制约和依存规则。
3.逻辑模型
逻辑数据模型由概念模型转化而来。目前数据库领域中主要的逻辑数据模型有:
层次模型(树)
网状模型(图)
关系模型(表)
面向对象数据模型
对象关系数据模型
半结构化数据模型
(1)层次模型
1.满足下面两个条件的基本层次联系的集合为层次模型:
(1)有且只有一个结点没有双亲结点,这个结点称为根结点;
(2)根以外的其它结点有且只有一个双亲结点。
2.特点:
- 结点的双亲是唯一的;
- 只能直接处理一对多的实体联系;
- 任何记录值只有按其路径查看时,才能显出它的全部意义;
- 没有一个子女记录值能够脱离双亲记录值而独立存在。
3.完整性约束条件
- 无相应的双亲结点值就不能插入子女结点值;
- 如果删除双亲结点值,则相应的子女结点值也被同时删除。
4.优缺点
优点
层次模型的数据结构比较简单清晰。
缺点
结点之间的多对多联系表示不自然;
对插入和删除操作的限制多,应用程序的编写比较复杂;
查询子女结点必须通过双亲结点。
(2)网状模型
1.满足下面两个条件的基本层次联系的集合:
(1)允许一个以上的结点无双亲;
(2)一个结点可以有多于一个的双亲。
2.优缺点
优点
能够更为直接地描述现实世界,如一个结点可以有多个双亲;
良好的性能,存取效率较高。
缺点
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握;
DDL、DML语言复杂,用户不容易使用;
(3)关系模型
最重要的一种数据模型,也是目前主要采用的数据模型
1.关系模型的术语
- 关系(Relation):一个关系对应通常说的一张表。
- 元组(Tuple):表中的一行即为一个元组。
- 属性(Attribute):表中的一列即为一个属性,给每一个属性起一个名称即属性名。
- 码(Key):表中的某个属性组,它可以唯一确定一个元组。
- 域(Domain):一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
- 分量:元组中的一个属性值。关系的每一个分量必须是一个不可分的数据项。
2.三大类完整性约束:实体完整性、参照完整性和用户定义的完整性
3.优缺点
优点:
建立在严格的数学概念的基础上:集合代数。
关系模型的概念单一:关系。
关系模型的存取路径对用户隐藏:更好的安全保密性。
缺点:
存取路径对用户隐藏,查询效率往往不如格式化数据模型。
三、数据库系统体系结构
1.结构层次:
- 从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构。
- 从数据库最终用户角度看,数据库系统的结构分为:
客户/服务器结构(Client/Server)
浏览器/服务器结构(Browser/Server)
分布式结构
2.数据库系统模式的概念
模式是相对稳定的,实例是相对变动的
- 模式(Schema)
数据库逻辑结构和特征的描述;
是型的描述;
反映的是数据的结构及其联系;
模式是相对稳定的。 - 模式的一个实例(Instance)
模式的一个具体值;
反映数据库某一时刻的状态;
同一个模式可以有很多实例;
实例随数据库中的数据的更新而变动。
3.数据库系统的三级模式结构
(1)模式(Schema)也称逻辑模式,数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图。
- 一个数据库只有一个模式。
- 模式的地位:是数据库系统模式结构的中间层。
- 与数据的物理存储细节和硬件环境无关。
- 与具体的应用程序、开发工具及高级程序设计语言无关。
- 定义模式
定义数据的逻辑结构(数据项的名字、类型、取值范围等)。
定义数据之间的联系。
定义数据有关的安全性、完整性要求。
(2)外模式(External Schema)也称子模式或用户模式,数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
- 外模式的地位:介于模式与应用之间。
- 模式与外模式的关系:一对多
- 外模式通常是模式的子集。
- 一个数据库可以有多个外模式。
(3)内模式(internal Schema)也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
- 记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储);
- 索引的组织方式;
- 数据是否压缩存储;
数据是否加密;
数据存储记录结构的规定。 - 一个数据库只有一个内模式。
4.数据库系统的两级映像
(1)外模式/模式映像
- 定义外模式与模式之间的对应关系。
- 每一个外模式都对应一个外模式/模式映象。
- 映象定义通常包含在各自外模式的描述中。
- 保证数据的逻辑独立性
当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变;
应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
(2)模式/内模式
- 模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。
- 数据库中模式/内模式映象是唯一的。
- 该映象定义通常包含在模式描述中。
- 保证数据的物理独立性
当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变;
应用程序不受影响,保证了数据与程序的物理独立性,简称数据的物理独立性。
四、数据库系统的组成
1.硬件平台及数据库
(1)数据库系统对硬件资源的要求
足够大的内存
(2) 足够大的外存
(3) 较高的通道能力,提高数据传送率
2.软件
- DBMS
- 操作系统
- 与数据库接口的高级语言及其编译系统
- 以DBMS为核心的应用开发工具
- 为特定应用环境开发的数据库应用系统