第一章 绪论
1.1 数据库系统概述
1.1.1数据库系统的4个基本概念
- 数据:描述事物的符号记录称为数据。
数据的含义为数据的语义,数据与其语义是不可分的。 - 数据库:数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。
数据库中的数据按一定的数据模型组织、描述和储存,具有较小冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 - 数据库管理系统(DBMS DataBase Management System)
数据库管理系统和操作系统一样是计算机的基础软件。 - 数据定义语言(DDL)
- 数据管理语言(DML)
- 数据控制语言(DCL)
主要功能包括:1. 数据定义功能 2.数据组织、存储和管理 3.数据操纵功能 4.数据的事务管理和运行管理 5. 数据为的建立和维护功能 - 数据库系统(DataBase System DMS)
数据库系统是由 : 数据库、数据库管理系统、应用程序和数据库管理员 组成的 存储、管理、处理和维护数据的系统。
从文件系统到数据库系统标志着数据管理技术的飞跃。
1.1.3 数据库系统的特点 - 数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
- 数据的共享性高、冗余度低且易扩充:数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够 避免数据之间的不相容性与不一致性。
3.数据独立性高
物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。 - 数据由数据库管理系统统一管理和控制
- 数据的安全性保护
数据的安全性是指保护数据以防止不合法使用造成的数据泄密和破坏。 - 数据的完整性检查
数据的完整性指数据的正确性、有效性和相容性。 - 并发控制
- 数据库恢复
1.2 数据模型
数据模型:它是对现实世界数据特征的抽象。数据模型是数据库系统的核心和基础。
1.2.1 两类数据模型
第一类是概念模型,第二类是逻辑模型和物理模型。
首先将世界抽象为信息世界,然后将信息世界转换为机器世界。
机器世界:逻辑模型+物理模型。
1.2.2 概念模型
- 信息世界中的基本概念
实体:客观存在并可相互区别的事物称为实体。
属性:实体所具有的某一特征称为属性。
码:唯一标识实体的属性称为码。
实体型:用实体名及其名集合来抽象和刻画同类实体,称为实体型。
联系:实体之间的联系通常是指不同的实体集之间的联系。
实体之间的联系有一对一、一对多和多对多等多种类型。 - 概念模型的一种表示方法:实体-联系方法
实体-联系 方法(Entity-Relationship approach) E-R方法也称为 E-R模型
1.2.3 数据模型的组成要素
数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。 - 数据结构:数据结构描述数据库的组成对象以及对象之间的联系。
- 数据操作:数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。
- 数据的完整性约束条件。数据的完整性约束条件是一组完整性规则。
1.2.4 常用的数据模型
层次模型、网关模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型
基本层次联系是指两个记录以及它们之间的一对多的联系。
1.2.5 层次模型 - 层次模型的数据结构
在数据库定义满足下面两个条件的基本层次联系的集合为层次模型。
层次模型像一棵倒立的树,结点的双亲是唯一的。
1.2.6 网状模型
网状数据模型的典型代表是DBTG系统,亦称 CODASYL 系统。 - 网状模型的数据结构
在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型。
层次模型中子女结点与双新结点的联系是唯一的,而在网状模型中这种联系可以不唯一。
1.2.7 关系模型
关系:一个关系对应一张表
元组:表中的一行即为一个元组
属性:表中的一列即为一个属性
码:也称为码键
域:域是一种具有相同数据类型的值的集合
分量:元组中的一个属性值
关系模式:对关系的描述
关系模型要求关系必须是规范化的。关系的每一个分量必须是一个不可分的数据项。
1.3 数据库系统的结构
1.3.1 数据库系统模式的概念
模式是相对稳定的,而实例是相对变动的。
1.3.2 数据库系统的三级模式结构 - 模式:模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
- 外模式:外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
- 内模式:内模式也称存储模式,一个数据库只有一个内模式,它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
1.3.3 数据库的二级映像功能与数据独立性 - 外模式/模式 映像
当模式改变时,由数据库管理员对各个外模式/模式映像作相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。 - 模式/内模式 映像
当数据库的存储结构改变时,由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性,简称数据的物理独立性。
2. 关系数据库
2.1 关系数据结构及形式化定义
2.1.1 关系
- 域
域是一组具有相同数据类型的值的集合。 - 笛卡尔积
一个域允许的不同取值个数称为这个域的基数。
侯选码:某一属性组的值能唯一地标识一个元组,而其子集不能,则称该属性组为侯选码。
侯选码的诸属性为主属性,不包含在任何侯选码中的属性称为非主属性,或非码属性。
关系可有三种类型:基本关系、查询表、视图表。
基本关系具有以下6条性质:- 列是同质的
- 不同的列可能出自同一个域
- 列的顺序无所谓
- 任意两个元组
- 行的顺序无所谓
- 分量必须取原子值
2.1.2 关系模式
关系的描述称为关系模式。
2.1.3 关系数据库
关系数据库的型也称为关系数据库模式,是对关系数据为的描述。关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常称为关系数据库。
2.2 关系操作
2.2.1 基本的关系操作
5个基本操作:选择、投影、并、差、笛卡儿积
2.2.2 关系数据语言的分类
结构化查询语言是集 查询、数据定义语言、数据操纵语言和数据控制语言于一体的关系数据语言。
2.3 关系的完整性
关系模型三类完整性约束:实体完整性、参照完整性、用户定义的完整性。
实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性。
差不多了,关系代数这方面需要多做点题目练习一下。那些字符我都打不出来。
第六章需要重点复习。