一·基本概念
- 数据,数据库中存储的基本对象。描述事物的符号记录。(数据的含义称为数据的语义,数据与其语义不可分,93可以为一个患者排队编号,也可以为患者年龄。)
- 数据库数据永久存储,有组织,可共享。
- 数据库(DB): 存放数据的仓库。严格的讲,数据库是在计算机内的有组织的,可共享的,大量数据的集合。
- 数据库管理系统(DBMS):计算机的基础软件,大型复杂的软件系统。
- 它的主要功能如下:(1)数据定义,用户通过它可以方便地对数据库中的数据对象的组成与结构进行定义。(2)数据组织存储和管理。数据库管理系统要分类组织,存储,和管理各种数据,要确定以何种文件结构和存取方式在存储上组织这些数据,如何实现数据之间的联系。数据组织和存储的目的是为了提高存储空间利用率和方便存取。提供多种存取方法(索引查找,hash查找,顺序查找等)来提高存取效率。(3)数据操纵功能。用户使用数据操纵语言操纵数据,实现如查询,插入,删除和修改等基本操作。(4)数据库的事务管理和运行管理。数据库在建立,运用和维护时由数据库管理系统统一管理和控制,以保证事物的正确运行,保证数据的安全性,完整性。(5)数据库的建立和维护功能(6)其他功能
- 数据库系统(DBS):数据库系统是由数据库,数据库管理系统,应用程序和数据库管理人员(DBA)组成的存储,管理,处理和维护数据的系统。
二.数据管理技术的产生和发展
- 人文管理
- 文件系统
- 数据库系统
从文件系统到数据库系统标志着数据管理技术的飞跃。
三.数据库系统的特点
- 数据结构化。
数据库主要特征之一。数据库系统与文件系统的本质区别。
2.共享性高,冗余度低且易扩张。
3. 数据具有独立性。
包括物理独立性(用户的应用程序与数据库中数据的物理存储相互独立)和逻辑独立性(与数据库的逻辑结构相互独立)。
4.数据由数据库管理系统统一控制和管理。
四.数据模型 ——数据库系统的核心和基础
数据模型由数据结构,数据操作和数据完整性约束条件组成。
1.概念模型
也称信息模型。按用户的观点来对数据和信息建模,主用于数据库设计。
①概念
实体,客观存在并可相互区别的事物。如一个学生,一个部门
属性,实体所属的某一特性。如学生的学号,性别。
码,唯一标识实体的属性集。
实体型,用实体名及其属性名集合来抽象和刻画同类实体。如学生(学号,姓名,性别)就是一个实体型。
实体集,同一类型实体的集合。如全体学生就是一个实体集。
联系:实体之间的联系通常指不同实体集之间的联系。实体间的联系有一对一,一对多,多对多。联系本身也是总实体型,也可以有属性。
姓名(属性) | 年级(属性) | 年龄(属性) | 学号(属性)(码) |
---|---|---|---|
熊大(实体) | 一年级 | 3 | 250 |
熊二(实体) | 一年级 | 5 | 500 |
熊大,熊二的每行为一个实体型 | |||
熊大加熊二的所有属性为一个实体集 |
概念模型的表示方式很多,最常用的是实体-联系方法。该方法用E-R图来描述。
2.逻辑模型和物理模型
逻辑模型按计算机系统的特点对数据建模。主要用于数据库管理系统的实现。包括层次模型,网状模型,关系模型等。
物理模型的具体实现是数据库管理系统的任务,数据库设计人员需了解,用户无需了解。
3.层次模型
(1)概念:①有且只有一个结点没有双亲结点,这个结点为根节点;
②根以外的其他结点有且只有一个结点。
(2)特点:①结点的双亲是唯一的;②只能处理一对多的实体联系;③任何一个给定的记录值只能按其层次路径查看,没有一个子女记录值能够脱离双亲而独立存在。
(3)在层次模型中,同一双亲结点的子女结点称为兄弟结点,没有子女结点的结点称为叶节点。
注意:如若对双亲结点进行删除操作,则子女结点的值也被删除。
4.网状模型
①允许一个以上的结点无双亲;
②一个结点可以有多于一个的双亲。
层次模型中子女结点与双亲结点的联系是唯一的,而在网状模型中可以不唯一。
5.关系模型(重点)
每个关系的数据结构是张规范化的二维表。关系的每个分量是不可在分的数据项。
(1)关系模型中一些术语:
关系: 一个关系通常对应一个表,如上图。
元组:表中的一行。
属性:表中的一列。
码:表中的某个属性组,它可以唯一确定一个元组。
域:一组具有相同数据类型的值的集合。属性的取值范围来自于某个域。如性别的域为(男,女)。
分量:元组中的一个属性值。
(2)关系模式,对关系的描述一般表示为 关系名(属性1,属性2,...,属性n)。
(3)关系模型中的数据操作就是集合操作,操作对象和操作结果都是关系。
(4)优点:①关系模型与格式化模型不同,他是建立在严格的数学概念的基础上的。
②关系模型的概念单一。对数据的检索和更新结果也是关系。所以数据结构简单清晰,用户易懂易用。
③关系模式的存取路径对用户透明,有更高的数据独立性,更好的安全保密性。
(5)缺点:查询效率不如格式化数据模型(网状和层次)。
五.数据库系统的结构
1.数据模型中有“型”和“值”的概念。型是对某一类数据的结构和属性的说明。值是型的一个具体赋值。(姓名为型,张三为值。)
2.模式是数据库中全体数据的逻辑结构和特征的描述。
模式的一个具体值称为模式的一个实例。同一个模式有多个实例。
模式是相对稳定的,实例是相对变动的。模式反映的是数据结构及联系,而实例反应的是数据库某一时刻的状态。(2020年学生选课数据库模式和2021年所对应的实例不一样)
3.数据库系统的三级模式结构
(1)三级模式结构指数据库系统由外模式,模式,内模式构成。
(2)模式:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个模式。
(3)外模式:也称子模式,或者用户模式,他是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。同一外模式可以被为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。(外模式通常是模式的子集)
(4)内模式:也称存储模式,一个数据库只有一个内模式,他是数据物理结构和存储方式的描述,是数据在数据库中内部的组织方式。如数据是否压缩存储,是否加密等。
4.数据库的二级映像功能与数据独立性
1).外模式/模式映像
对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系。
当模式改变时(例如增加新的模式),由数据库管理员对各个外模式/模式的映像作相应改变,可以使外模式保持不变。应用程序依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
2).模式/内模式映像
模式/内模式映像是唯一的。它定义了数据全局逻辑结构与存储结构之间的对应关系。
当数据库的存储结构改变时,由数据管理人员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。