一、
1.1 数据库系统概述
1.1.1.数据
(1)数据(Data)是数据库中存储的基本对象
(2)数据的定义
描述事物的符号记录
(3)数据的种类
数字、文字、图形、图像、音频、视频、学生的档案记录等
2.数据举例
(1)数据的含义称为数据的语义,数据与其语义是不可分的。
例如 93是一个数据
语义1:学生某门课的成绩
语义2:某人的体重
语义3:计算机系2013级学生人数
语义4:请同学给出……
(2)学生档案中的学生记录
(李明,男,199505,江苏南京市,计算机系,2013)
语义:学生姓名、性别、出生年月、出生地、所在院系、入学时间
解释:李明是个大学生,1995年5月出生,江苏南京市人, 2013年考入计算机系
1.1.2.数据库
(1)数据库的定义
数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合。
(2)数据库的基本特征
数据按一定的数据模型组织、描述和储存
可为各种用户共享
冗余度较小
数据独立性较高
易扩展
1.1.3.数据库管理系统
(1)什么是数据库管理系统
位于用户与操作系统之间的一层数据管理软件
是基础软件,是一个大型复杂的软件系统
(2)数据库管理系统的用途
科学地组织和存储数据、高效地获取和维护数据
(3)数据库管理系统的主要功能
【1】数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象
【2】数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
【3】数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改)
【4】数据库的事务管理和运行管理
数据库在建立、运行和维护时由数据库管理系统统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复
【5】数据库的建立和维护功能
数据库初始数据的装载和转换
数据库转储、恢复功能
数据库的重组织
性能监视、分析等
【6】其它功能
数据库管理系统与网络中其它软件系统的通信
数据库管理系统系统之间的数据转换
异构数据库之间的互访和互操作
提供多种存取方法提高存取效率
1.1.4数据库系统
(1)数据库系统(Database System,简称DBS)
(2)数据库系统的构成
数据库
数据库管理系统(及其应用开发工具)
应用程序
数据库管理员
1.1.5.数据库系统的特点
1.数据结构化
2.数据的共享性高,冗余度低且易扩充
3.数据独立性高
4.数据由数据库管理系统统一管理和控制
1.1.6.数据结构化
(1)数据的整体结构化是数据库的主要特征之一
(2)整体结构化
1.不再仅仅针对某一个应用,而是面向全组织
2.不仅数据内部结构化,整体是结构化的,数据之间具有联系
数据记录可以变长
3.数据的最小存取单位是数据项
数据的用数据模型描述,无需应用程序定义
1.1.7.数据的共享性高,冗余度低且易扩充
(1)数据面向整个系统,可以被多个用户、多个应用共享使用。
(2)数据共享的好处
减少数据冗余,节约存储空间
避免数据之间的不相容性与不一致性
使系统易于扩充
1.1.8.数据独立性高
(1)物理独立性
指用户的应用程序与数据库中数据的物理存储是相互独立的。当数据的物理存储改变了,应用程序不用改变。
(2)逻辑独立性
指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,应用程序不用改变。
数据独立性由数据库管理系统的二级映像功能来保证
1.1.9.数据由数据管理系统统一管理和控制
数据库管理系统提供的数据控制功能
(1)数据的安全性(Security)保护
保护数据以防止不合法的使用造成的数据的泄密和破坏。
(2)数据的完整性(Integrity)检查
保证数据的正确性、有效性和相容性。
(3)并发(Concurrency)控制
对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
(4)数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。
1.2.数据模型
1.2.1.两类数据模型
数据模型分为两类(两个不同的层次)
(1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计。
(2) 逻辑模型和物理模型
1.逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
2.物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
1.2.2.概念模型
1. 信息世界中的基本概念
(1)实体(Entity)
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
(2)属性(Attribute)
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
(3)码(Key)
唯一标识实体的属性集称为码。
(4)实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为
实体型
(5)实体集(Entity Set)
同一类型实体的集合称为实体集
(6)联系(Relationship)
现实世界中事物内部以及事物之间的联系在信息世界
中反映为实体(型)内部的联系和实体(型)之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系
实体之间的联系有一对一、一对多和多对多等多种类型
2.实体-联系方法
实体-联系方法(Entity-Relationship Approach)
用E-R图来描述现实世界的概念模型
E-R方法也称为E-R模型
1.2.3 数据模型的组成要素
1. 数据结构
(1)数据模型的数据结构
描述数据库的组成对象,以及对象之间的联系
(2)描述的内容
1. 与对象的类型、内容、性质有关
2. 与数据之间联系有关
(3)数据结构是对系统静态特性的描述
2. 数据操作
(1)数据操作
对数据库中各种对象(型)的实例(值)允许执行的
操作的集合,包括操作及有关的操作规则
(2)数据操作的类型
查询
更新(包括插入、删除、修改)
(3)数据模型对操作的定义
操作的确切含义
操作符号
操作规则(如优先级)
实现操作的语言
(4)数据操作是对系统动态特性的描述
3. 数据的完整性约束条件
(1)数据的完整性约束条件
一组完整性规则的集合
完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则
用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容
(2)数据模型对完整性约束条件的定义
反映和规定必须遵守的基本的通用的完整性约束条件。
提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
1.2.4 常用的数据模型
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model))
面向对象数据模型(Object Oriented Data Model)
对象关系数据模型(Object Relational Data Model)
半结构化数据模型(Semistruture Data Model)
1.2.5 层次模型
层次模型是数据库系统中最早出现的数据模型
层次数据库系统的典型代表是IBM公司的IMS(Information Management System)数据库管理系统
层次模型用树形结构来表示各类实体以及实体间的联系
1.2.6 网状模型
(1)网状数据库系统采用网状模型作为数据的组织方式
(2)典型代表是DBTG系统:
亦称CODASYL系统
20世纪70年代由DBTG提出的一个系统方案
(3)实际系统
Cullinet Software公司的 IDMS
Univac公司的 DMS1100
Honeywell公司的IDS/2
HP公司的IMAGE
1.2.7 关系模型
(1)关系(Relation)
一个关系对应通常说的一张表
(2)元组(Tuple)
表中的一行即为一个元组
(3)属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名
(4)主码(Key)
也称码键。表中的某个属性组,它可以唯一确定一个元组
(5)域(Domain)
是一组具有相同数据类型的值的集合。属性的取值范围来自某个域。
(6)分量
元组中的一个属性值。
(7)关系模式
对关系的描述
关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系名,年级)
1.3 数据库系统的结构
(1)从数据库应用开发人员角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构
从数据库最终用户角度看,数据库系统的结构分为:
单用户结构
主从式结构
分布式结构
客户-服务器
浏览器-应用服务器/数据库服务器多层结构等
1.3.1 数据库系统模式的概念
(1)“型” 和“值” 的概念
型(Type):
对某一类数据的结构和属性的说明
值(Value):
是型的一个具体赋值
例如:
学生记录:
(学号,姓名,性别,系别,年龄,籍贯)
一个记录值:
(201315130,李明,男,计算机系,19,江苏南京市)
(2)模式(Schema)
数据库逻辑结构和特征的描述
是型的描述,不涉及具体值
反映的是数据的结构及其联系
模式是相对稳定的
(3)实例(Instance)
模式的一个具体值
反映数据库某一时刻的状态
同一个模式可以有很多实例
实例随数据库中的数据的更新而变动
1.3.2 数据库系统的三级模式结构
1. 模式(Schema)
(1)模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述
所有用户的公共数据视图
(2)一个数据库只有一个模式
(3)模式的地位:是数据库系统模式结构的中间层
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关
(4)模式的定义
数据的逻辑结构(数据项的名字、类型、取值范围等)
数据之间的联系
数据有关的安全性、完整性要求
2. 外模式(External Schema)
(1)外模式(也称子模式或用户模式)
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
(2)外模式的地位:介于模式与应用之间
模式与外模式的关系:一对多
外模式通常是模式的子集
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用的关系:一对多
同一外模式也可以为某一用户的多个应用系统所使用
但一个应用程序只能使用一个外模式
(3)外模式的用途
保证数据库安全性的一个有力措施
每个用户只能看见和访问所对应的外模式中的数据
3. 内模式(Internal Schema)
(1)内模式(也称存储模式)
是数据物理结构和存储方式的描述
是数据在数据库内部的表示方式
记录的存储方式(例如,顺序存储,按照B树结构存储,
按hash方法存储等)
索引的组织方式
数据是否压缩存储
数据是否加密
数据存储记录结构的规定
(2)一个数据库只有一个内模式
1.3.3.数据库的二级映像功能与数据独立性
1. 外模式/模式映像
模式:描述的是数据的全局逻辑结构
外模式:描述的是数据的局部逻辑结构
同一个模式可以有任意多个外模式
每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
映象定义通常包含在各自外模式的描述中
1.4 数据库系统的组成
数据库
数据库管理系统(及其开发工具)
应用程序
数据库管理员