数据库概述
四个基本概念
数据(Data)
是数据库中存储的基本对象
-
定义:描述事物的符号记录
-
数据的种类:文字、图形、图像、声音、视频等
-
数据的特点:数据与其语义是不可分的
- 例:学生档案中的学生记录(李明,男,2001,江苏,计算机科学与技术学院,2019)
数据的解释
语义:学生姓名、性别、出生年月、籍贯、所在学院、入学时间
解释:李明是个大学生,2001年出生,江苏人,2019年考入计算机科学与技术学院。
数据库
- 定义:存放数据的仓库
数据库是长期储存在计算机内、有组织的、可共享的大量数据集合
-
数据库的特征:
-
数据按一定的数据模型组织、描述和储存**
-
可为各种用户共享
-
冗余度较小
-
数据独立性较高
-
易扩展
-
DBMS(数据库管理系统)
-
定义:数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
-
用途:科学地组织和存储数据、高效地获取和维护数据。
-
的主要功能:
-
数据定义功能:提供数据定义语言(DDL)
-
数据组织存储管理
-
数据操纵功能:提供数据操纵语言(DML)
-
数据库的事务管理和运行管理
-
数据库的建立和维护功能(实用程序)
-
Others
-
DBS(数据库系统)
- 定义:数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。在不引起混淆的情况下常常把数据库系统简称为数据库
- 数据库系统的构成:由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。
- 数据管理:对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。
- 数据管理技术的发展过程
阶段 | 时间 |
---|---|
人工管理阶段 | 40年代中–50年代中 |
文件系统阶段 | 50年代末–60年代中 |
数据库系统阶段 | 60年代末–现在 |
-
数据管理技术的发展动力
-
应用需求的推动
-
计算机硬件的发展
-
计算机软件的发展
-
数据库系统特点:
-
数据结构化
-
整体数据的结构化是数据库的主要特征之一。
-
数据库中实现的是数据的真正结构化
-
数据的结构用数据模型描述,无需程序定义和解释。
-
数据可以变长。
-
数据的最小存取单位是数据项。
-
-
数据的共享性高、冗余度低、易扩充
-
降低数据的冗余度,节省存储空间
-
避免数据间的不一致性
-
使系统易于扩充
-
-
数据独立性高
-
物理独立性:指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。
-
逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。
-
DBMS对数据的控制功能
-
数据的安全性(Security)保护
使每个用户只能按指定方式使用和处理指定数据,保护数据以防止不合法的使用造成的数据的泄密和破坏。**
-
数据的完整性(Integrity)检查
将数据控制在有效的范围内,或保证数据之间满足一定的关系。
-
并发(Concurrency)控制
对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
-
数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。
数据模型
基本概念
数据模型是现实世界数据特征的抽象(现实世界的模拟)
在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
抽象原则
-
数据模型应满足三方面要求
-
能比较真实地模拟现实世界**
-
容易为人所理解**
-
便于在计算机上实现**
模型分类
-
概念模型
也称信息模型,它是按用户的观点来对数据和信息建模
-
逻辑模型和物理模型
-
逻辑模型主要包括网状模型、层次模型、关系模型、面向对象模型等,它是按计算机系统的观点对数据建模
-
物理模型是对数据最低层次的抽象,面向计算机的。
-
客观对象的抽象过程
-
现实世界中的客观对象抽象为概念模型;
-
把概念模型转换为某一DBMS支持的数据模型。
-
概念模型是现实世界到机器世界的一个中间层次。
数据模型的组成要素
数据结构
-
数据结构,对象类型的集合
-
两类对象
-
与数据类型、内容、性质有关的对象
-
与数据之间联系有关的对象
-
-
数据结构是对系统静态特性的描述
数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则
数据操作的类型:
-
查询
-
更新(包括插入、删除、修改)
-
数据操作是对系统动态特性的描述。
数据的完整性约束条件
数据的完整性约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
数据模型应反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。
数据模型应提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
概念模型
-
概念模型的用途
-
概念模型用于信息世界的建模
-
是现实世界到机器世界的一个中间层次
-
是数据库设计的有力工具
-
数据库设计人员和用户之间进行交流的语言
-
-
对概念模型的基本要求
-
较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识**
-
简单、清晰、易于用户理解。
-
信息世界基本概念
实体(Entity)
-
客观存在并可相互区别的事物称为实体。
-
可以是具体的人、事、物或抽象的概念。
属性(Attribute)
-
实体所具有的某一特性称为属性。
-
一个实体可以由若干个属性来刻画。
码(Key)
- 唯一标识实体的属性集称为码。
域(Domain)
- 属性的取值范围称为该属性的域。
实体型(Entity Type)
- 用实体名及其属性名集合来抽象和刻画同类实体称为实体型
实体集(Entity Set)
- 同型实体的集合称为实体集
联系(Relationship)
-现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系
-
实体型间联系
-
两个实体型 一对一联系(1:1)
-
三个实体型 一对多联系(1:n)
-
一个实体型 多对多联系(m:n)
-
实体联系:
-
一对一联系
如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。
实例:
班级与班长之间的联系:一个班级有一个正班长, 一个班长只在一个班中任职
-
一对多联系
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系。记为1:n
实例
班级与学生之间的联系:一个班级中有若干名学生,每个学生只在一个班级学
-
多对多联系(m:n)
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系。记为m:n
实例
课程与学生之间的联系:一门课程同时有若干个学生选修, 一个学生可以同时选修多门课程
-
多个实体型间的一对多联系
若实体集E1,E2,…,En存在联系,对于实体集Ej(j=1,2,…,i-1,i+1,…,n)中的给定实体,最多只和Ei中的一个实体相联系,则我们说Ei与E1,E2,…,Ei-1,Ei+1,…,En之间的联系是一对多的。
实例
课程、教师与参考书三个实体型
如果一门课程可以有若干个教师讲授,使用若干本参考书,每一个教师只讲授一门课程,每一本参考书只供一门课程使用课程与教师、参考书之间的联系是一对多的多个实体型间的一对一联系多个实体型间的多对多联系
一对多联系
实例职工实体集内部具有领导与被领导的联系某一职工(干部)“领导”若干名职工一个职工仅被另外一个职工直接领导这是一对多的联系
关系模型的优缺点
优点
-
建立在严格的数学概念的基础上
-
概念单一。数据结构简单、清晰,用户易懂易用
-
实体和各类联系都用关系来表示。
-
对数据的检索结果也是关系。
-
关系模型的存取路径对用户透明
-
具有更高的数据独立性,更好的安全保密性
-
简化了程序员的工作和数据库开发建立的工作
缺点
-
存取路径对用户透明导致查询效率往往不如非
-
关系数据模型
-
为提高性能,必须对用户的查询请求进行优化
-
增加了开发数据库管理系统的难度
模式
模式(也称逻辑模式)
-
数据库中全体数据的逻辑结构和特征的描述
-
所有用户的公共数据视图,综合了所有用户的需求
-
一个数据库只有一个模式
-
模式的地位:是数据库系统模式结构的中间层
-
与数据的物理存储细节和硬件环境无关
-
与具体的应用程序、开发工具及高级程序设计语言无关
-
模式的定义
-
数据的逻辑结构(数据项的名字、类型、取值范围等)
-
数据之间的联系
-
数据有关的安全性、完整性要求
-
外模式(也称子模式或用户模式)
-
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
-
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
-
外模式的地位:介于模式与应用之间
-
模式与外模式的关系:一对多
-
外模式通常是模式的子集
-
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
-
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
-
外模式与应用的关系:一对多
-
同一外模式也可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。
-
外模式的用途:保证数据库安全性的一个有力措施。
-
每个用户只能看见和访问所对应的外模式中的数据
内模式(也称存储模式)
-
是数据物理结构和存储方式的描述
-
是数据在数据库内部的表示方式
-
记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)
-
索引的组织方式
-
数据是否压缩存储
-
数据是否加密
-
-
数据存储记录结构的规定:一个数据库只有一个内模式