教材:
数据库系统概论(第6版)王珊,杜小勇,陈红编著
一、数据库系统概论
1.1数据库的4个基本概念
数据(Data)
是数据库中存储的基本对象
定义:描述事物的符号记录
数据的含义称为数据的语义,数据与其语义是不可分的
数据库(Database,DB)
是长期内储在计算机内有组织的,可共享的大量数据的集合
基本特征:
(1)冗余库较小
(2)数据独立性较高
(3)数据按一定的数据模型组织、描述和储存
(4)可为各种用户共享
(5)可扩展性
数据库管理系统(DataBase Management System,DBMS)
用途:(1)科学地组织和存储数据 (2)高效地获取和维护数据
定义:是位于用户与操作系统之间的数据管理软件, 是计算机的基础软件
主要功能:
(1)数据定义功能:提供数据定义语言(DDL) ;定义数据库中的数据对象
(2)数据组织、存储和管理:确定组织数据的文件结构和存取方式;实现数据之间的联系;提供多种存取方法提高存取效率
(3)数据操纵功能:提供数据操纵语言(DML);实现对数据库的基本操作 (查询、插入、删除和修改)
(4)数据库的事务管理和运行管理:保证数据的安全性、完整性、多用户对数据的并发使用;发生故障后的系统恢复
(4)数据库的建立和维护功能:初始数据的输入和转换;l数据库转储和恢复功能;数据库的重组织、性能监视和数据分析
(5)其它功能:统与网络中其它软件系统的通信;系统之间的数据转换 ;异构数据库之间的互访和互操作
数据库系统 (Database System,简称DBS)
构成:
(1)数据库(2)数据库管理系统(及其应用开发工具) (3)应用程序 (4)数据库管理员
从组成的角度, DBMS是整个数据库系统的核心
1.2 数据管理技术的产生和发展
发展过程:人工管理阶段 ;文件系统阶段 ;数据库系统阶段
数据管理 :对数据进行分类、组织、编码、存储、检索和维护
1.3 数据库系统的特点
1.数据结构化
数据的整体结构化(数据库系统阶段与文件系统阶段的本质区别)
面向整个组织或企业的多种应用需求;数据之间具有联系(描述数据之间的联系);数据记录可以变长;数据的最小存取单位是数据项;
2.数据的共享性高,冗余度低且易扩充
数据共享的好处 :(1)减少数据冗余,节约存储空间 (2)避免数据之间的不相容性与不一致性 (3)使系统易于扩充
3.数据独立性高、
(1)物理独立性——用户的应用程序与数据库中数据的物理存储是相互独立的
(2)逻辑独立性——用户的应用程序与数据库的逻辑结构是相互独立的
4.数据由数据库管理系统统一管理和控制
(1)数据的安全性(Security)保护
(2)数据的完整性(Integrity)检查
(3)并发(Concurrency)控制
(4)数据库恢复(Recovery)
二、 数据模型
数据模型是数据库系统的核心和基础;是现实世界的模拟;是用来描述数据、组织数据和对数据进行操作的
数据模型都是逻辑上的
物理模型:数据模型以一定的组织方式存储在数据库管理系统中,是数据模型在数据库管理系统内部的物理存储结构
2.1 数据建模
定义:把现实世界中的具体事物抽象、组织为某一数据库管理系统支持的数据模型
建模过程(两步抽象):将现实世界抽象为信息世界→将信息世界转换为机器世界
2.2 概念模型
用于信息世界的建模;是数据库设计人员和用户之间进行交流的语言;是从现 实世界到机器世界的一个中间层次
信息世界中的基本概念
(1)实体:客观存在并可相互区别的事物
(2)属性:实体所具有的某一特性
(3)码:唯一标识实体的属性集(一个实体可以存在多个码)
(4)实体类型:用实体名及其属性名集合来抽象和刻画同类实体
(5)实体集:同一类型实体的集合
(6)联系:实体内部的联系→组成实体的各属性之间的联系;
实体之间的联系(一对一、一对多和多对多等多种类型)→指不同实体集之间的联系
实体-联系方法(E-R模型)
2.3 数据模型的三要素
数据模型的组成要素:
1.数据结构,描述数据库的组成对象以及对象之间的联系
对系统静态特性的描述
2.数据操作(查询、删除、插 入、修改等);
对系统动态特性的描述
3.完整性约束(完整性规则)
2.4 层次模型
(数据库系统中最早出现的数据模型)
实体用记录表示;实体的属性对应记录的数据项(字段);实体之间的联系转换成记录之间的两两联系;数据结构的单位是基本层次联系
层次模型用树形结构来表示各类实体以及实体间的联系
2.5 网状模型
表示方法与层次数据模型相同
网状数据库系统采用网状模型作为数据的组织方式
代表:DBTG系统(CODASYL系统)
2.6 关系模型
在用户观点下,关系模型由一组关系组成,每个关系的数据结构是一张规范化的二维表
它由行和列组成
关系术语 | 一般表格的术语 |
关系名 | 表名 |
关系模式 | 表头(表格的描述) |
关系 | (一张)二维表 |
元组 | 记录或行 |
属性 | 列 |
属性名 | 列名 |
属性值 | 列值 |
分量 | 一条记录中的一个列值 |
非规范关系 | 表中有表(大表中嵌有小表) |
码(码键):表中的某个属性组,它可以唯一确定一个元组
分量 :元组中的一个属性值
域:是一组具有相同数据类型的值的集合。属性的取值范围来 自某个域。
关系模式:
关系名(属性1,属性2,…,属性n)
三、 数据库系统的三级模式结构
数据库管理系统角度:数据库系统内部的体系结构 (模式,外模式,内模式)
3.1概念
型(Type) :对某一类数据的结构和属性的说明
值(Value) :是型的一个具体赋值
模式(Schema) :数据库逻辑结构和特征的描述
是型的描述,不涉及具体值 ;反映的是数据的结构及其联系
实例(Instance) :模式的一个具体值
反映数据库某一时刻的状态
3.2三级模式结构
模式(逻辑模式) :数据库中全体数据的逻辑结构和特征的描述
一个数据库只有一个模式
外模式(子模式或用户模式): 数据库用户使用的局部数据的逻辑结构和特征的描述
一个数据库可以有多个外模式
内模式(存储模式): 是数据物理结构和存储方式的描述; 是数据在数据库内部的表示方式。
3.3数据库的二级映像功能与数据独立性
外模式/模式映象:保证逻辑独立性
模式改变时,外模式保持不变;
模式/内模式映象:保证物理独立性
内模式(数据库的物理存储结构)改变时,模式保持不变, 应用程序不受影响;
四、 数据库系统的组成
支撑数据库系统的三个方面:
1、硬件平台
2、软件平台
3、人员(数据库管理员 / 系统分析员和数据库设计人员 / 应用程序员 / 最终用户)
数据库管理员(DBA):
- 设计与定义数据库
- 帮助最终用户使用数据库系统
- 负责数据库系统的运维工作
- 改进和重组数据库系统,调优数据库系统的性能
- 转储与恢复数据库
- 重构数据库
注意:数据库管理系统设计不是DBA数据库管理员的职责。