文章目录
1.1 数据库系统概述
1.1.1 数据库四个基本概念
1.数据
数据(data):
- 是数据库中存储的基本对象,
- 是
描述事物的符号记录
。(不局限于数值类数据)。
tip:描述事物的符号:文字(text)、图形(graph)、图像(image)、音频(audio)、视频(video)等多种表现形式。
- 数据的表现形式不能完全表达其内容,需要经过解释,数据关于数据的解释是不可分的。
tip:数据的含义(解释)为数据的语义,数据与语义是不可分的。
- 数据是具有结构的。
tip:一条学生记录就是描述学生的数据,是具有结构的。记录是表示和存储数据的一种格式或一种方法。
2.数据库——如何存放数据?
数据库(DataBase,DB):
1.数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。
2.数据库中的数据按一定的数据模型组织、描述和存储。
3.具有较小的冗余度(redundancy)、较高的数据独立性(data independency ) 和易扩展性(scalability)。
4.并可为各种用户共享。
3.数据库管理系统——如何科学地组织和存储数据,如何高效地获取和维护数据?
数据库管理系统(DataBase Management System,DBMS):数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
要完成的功能包括:
功能定义 | 具体职能 |
---|---|
数据定义功能 | 数据定义语言(Data Definition Language,DDL)对数据库中的数据对象进行组成与结构定义 |
数据组织、存储和管理 | 分类组织(数据字典、用户数据、数据存取路径)、存储(以何种文件结构)和管理 |
数据操纵功能 | 数据操纵语言(Data Manipulation Language,DML)对数据库进行插入(增)、删除(删)、修改(改)、查询(查)等基本操作 |
数据库的事务管理和运行管理 | 对数据库的建立、运行和维护进行统一的管理和控制(1.保证事务的正确运行保证数据的安全性、2.完整多用户对数据的并发使发生故障后的系统恢复) |
数据库的建立和维护功能 | 1.数据库数据批量、2.数据库转储、3.介质故障恢复、4.数据库的重组织、5.性能监视 |
4.数据库系统
数据库系统(DataBase System,DBS):数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序、数据库管理员组成的存储、管理、处理和维护数据的系统。
借助示意图理解:
引入数据库系统后的计算机系统层次
硬件–>操作系统–>数据库管理系统–>应用开发工具–>应用系统
1.1.2 数据管理技术的产生和发展
数据管理:对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。
阶段 | 应用需求 | 硬件水平 | 软件水平 | 处理方式 |
---|---|---|---|---|
人工管理阶段 | 科学计算 | 无直接存取存储设备 | no OS | 批处理 |
文件系统阶段 | 科学计算、数据管理 | 磁盘、磁鼓 | 文件系统 | 联机实时处理、批处理 |
数据库系统阶段 | 大规模数据管理 | 大容量磁盘、磁盘阵列 | 数据库管理系统 | 联机实时处理、批处理、分布处理 |
阶段 | 数据的管理者 | 数据的面向对象 | 数据的共享程度 | 数据的独立性 | 数据的结构化 | 数据的控制能力 |
---|---|---|---|---|---|---|
人工管理阶段 | 用户(程序员) | 某一应用程序 | 无共享 | 不独立 | 无结构 | 应用程序控制 |
文件系统阶段 | 文件系统 | 某一应用 | 共享性差 | 独立性差 | 记录有结构,整体无结构 | 应用程序控制 |
数据库系统阶段 | 数据库管理系统 | 组织 | 共享性高 | 物理和逻辑独立性强 | 记录有结构,整体结构化(数据模型) | 数据库控制 |
1.2 数据模型
模型:对现实世界某个对象特征的模拟和抽象。
人们首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界
。
数据模型(data model): 也是一种模型
,它是对现实世界数据特征的抽象
。数据模型是用来描述数据
、组织数据
和对数据操作的
。就是对现实世界的模拟。数据模型是数据库的核心和基础
。
数据模型的组成要素
数据结构
定义:描述数据库的组成对象及对象之间的联系。
内容:
与数据类型、内容、性质有关的对象
与数据之间联系有关的对象
特点:数据结构是对系统静态特性的描述
数据操作
定义:对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则。
内容:
查询
更新(包括插入、删除、修改)
特点:数据操作是对系统动态特性的描述
数据的完整性约束条件
定义:
一组完整性规则的集合。
完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合 数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
1.2.1 两种数据模型
根据模型应用的不同目的
,划分成:
概念模型
概念模型(conceptual model):也称信息模型,按照用户的观点来对数据和信息进行建模,主要用于数据库的设计。
- 实体(entity)
客观存在并可相互区别的事物。
一个学生。
- 属性(attribute)
实体所具有的某一特性称为属性。
学生的学号,姓名,性别,出生年月,所在院系,入学时间就是各种属性。
- 码(key)
唯一标识实体的属性集称为码。
假如用学号来筛除学生,学号就是学生实体的码。
- 实体型(entity type)
具有相同属性的实体必然具有共同特征和性质。用实体名及其属性名集合来抽象刻画同类实体,称为实体型。
学生(学号,姓名,性别,出生年月,所在院系,入学时间)就是一个实体型。
- 实体集(entity set)
同一类型的集合称为实体集。
全体学生就是一个实体集。
- 联系(relationship)
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系。
逻辑模型
逻辑模型:按计算机系统的观点对数据建模,主要用于数据库管理系统的实现
物理模型
物理模型:对数据最底层的抽象,它描述数据在系统内部的表式方法和存取方法,或在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。