1.1数据库系统概述
1.1.1四个基本概念
数据,数据库,数据库管理系统和数据库系统。
1,数据:描述事物的符号记录称为数据。
是数据库中存储的基本对象。现代计算机系统中数据的概念是广义的。
2,数据库:存放数据的仓库。
数据库是长期储存在计算机内,有组织的,可共享的大量数据的集合。数据库中的数据按一定数据模型组织,描述和储存,具有较小的冗余度,较高的数据独立性和易扩展性。具有永久存储,有组织和可共享三个基本特点。
3,数据库管理系统:位于用户与操作系统之间的一层数据管理软件。
主要功能:
(1)数据定义功能:用户通过数据定义语言DDL可以对数据库中的数据对象的组成与结构进行定义。
(2)数据组织,存储和管理:包括数据字典,用户数据,数据的存取路径等。基本目标是提高存储空间利用率和方便存取。
(3)数据操纵功能:用户可以使用数据操纵语言实现对数据库的基本操作,增删改查筹。
(4)数据库的事务管理和运行管理:数据库在建立,运用和维护时由数据库管理系统统一管理和控制。
(5)数据库的建立和维护功能:包括数据库初始数据的输入,转换功能等
(6)其他功能:通信功能,数据转按功能等。
4,数据库系统:由数据库,数据库管理系统,应用程序和数据库管理员组成的存储,管理,处理和维护数据的系统。
1.1.2数据管理技术的产生和发展
数据管理技术经历了人工管理,文件系统,数据库系统三个阶段。
1,人工管理阶段
背景:科学计算,无直接存取存储设备,没有操作系统,批处理。
特点:数据不保存,应用程序管理数据,数据不共享,数据不具有独立性。
2,文件系统阶段
特点:数据可以长期保存,由文件系统管理数据。
缺点:数据共享性差,冗余度大。数据独立性差。
3,数据库系统阶段
优:共享性高,冗余度小。具有高度的物理独立性和一定的逻辑独立性。整体结构化等。
1.1.3数据库系统的特点
1,数据结构化:数据整休结构化,存取方式灵活。
2,数据的共享性高,冗余度低且易扩充。
3,数据独立性高:包括数据的物理独立性和逻辑独立性。
物理独立性:用户的应用程序与数据库中数据的物理存储相互独立。
逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的。
数据独立性是由数据库管理系统提供的二级映像功能来保证的。
4,数据由数据库管理系统统一管理和控制
必须提供的数据控制功能:
(1)数据的安全性保护 (2)数据的完整性检查
(3)并发控制 (4)数据库恢复
1.2数据模型
对现实世界数据特征的抽象。
1.2.1两类数据模型
数据模型应满足三方面要求:1,能比较真实地模拟现实世界。2,容易为人所理解。3,便于在计算机上实现。
第一类概念模型 按用户的观点来对数据和信息建模。
第二类逻辑模型和物理模型。包括层次模型,网状模型,关系模型,面向对象数据模型等。逻辑模型按计算机系统的观点对数据建模。物理模型是对数据最底层的抽象。
1.2.2概念模型
1,信息世界中的基本概念:实体,属性,码,实体型,实体集,联系。
实体:客观存在并可相互区别的事物。
属性:实体所具有的某一特性。
码:唯一标识实体的属性。
实体型:具有相同属性的实体必然具有共同的特征和性质。
实体集:同一类型实体的集合。
联系:事物内部以及事物之间是有联系的。
2,实体-联系方法
用E-R图来描述现实世界的概念模型。
1.2.3数据模型的组成要素
通常由数据结构,数据操作和数据的完整性约束条件三部分组成。
1,数据结构:描述数据库的组成对象以及对象之间的联系。
2,数据操作:对数据库中各种对象的实例允许执行的操作的集合。
3,数据的完整性约束条件。
1.2.4常用的数据模型
层次模型,网状模型,关系模型,面向对象数据模型,对象关系数据模型,半结构化数据模型。
其中层次模型和网状模型统称为格式化模型。
格式化模型中数据结构的单位是基本层次联系,它指两个记录以及它们之间一对多的联系。有双亲结点与子女结点。
1,层次模型是数据库系统中最早出现的数据模型。(1)有且只有一个结点没有双亲结点,根结点(2)根以外的其他结点有且只有一个双亲结点。
同一双亲的子女结点称为兄弟结点。
优(1)数据结构比较简单清晰。(2)查询效率高。(3)提供了良好的完整性支持。
缺(1)现实世界中很多联系是非层次性的(2)应用程序的编写比较复杂(3)查询子女结点必须通过双亲结点(4)结构严密,层次命令趋于程序化。
2,网状模型,克服了现实世界中很多联系是非层次性的难题。(1)允许一个以上结点无双亲(2)一个结点可以有多个双三天。
优(1)能更直接地描述现实世界。(2)具有良好的性能,存取效率较高。
缺(1)结构复杂。(2)网状模型的DDL,DML复杂且要嵌入一种高级语言中。(3)加重了编写应用程序的负担。
3,关系模型
术语:关系,元组,属性,码,域,分量,关系摸式。表中一行即为一个元组,分量是元组中的一个属性值。
优:(1)建立在严格的数学概念的基础上。(2)关系模型的概念单一。(3)存取路径透明。
缺:查询效率往往不如格式化模型。
1.3数据库系统的结构
三级模式结构
模式是数据库中全体数据的逻辑结构和特征的描述,仅涉型的描述,不涉及具体的值。
三级模式结构是指数据库系统是由外模式,模式,内模式三级构成。
1,模式,中间层,一个数据库只有一个模式
定义摸式不仅要定义数据的逻辑结构,还要定义数据之间的联系。
2,外模式,模式的子集,一个数据库可以有多个外模式,一个应用程序只能使用一个外模式,一个外模式可以为某一用户的多个应用系统所使用。
3,内模式,一个数据库只有一个内模式
二级映像功能与数据独立性
数据库管理系统在三级模式之间提供了两层映像,外模式/模式映像,模式/内模式映像保证了较高的逻辑独立性,物理独立性。
1.4数据库系统的组成
1,硬件平台及数据库。2,软件。3,人员。