第一章 数据库系统概论
1.1 数据库的定义
数据
- 数据(Data)是数据库中存储的基本对象。文字、数字、图形、图像、视频、学生信息等都是数据,都可以经过数字化以后保存在计算机中。
- 数据的语义:数据的含义称为数据的语义,数据与语义是不可分的。
信息
- 信息(Information)是对现实世界事物存在方式或运动状态的反应,是加工后的数据,它会对接收者的行为或决策产生影响,具有现实的或者潜在的价值。
- 能源、物质、信息并列为人类社会活动的三大要素。
- 数据是信息的载体,信息是数据的内涵。同一信息可以有不同的数据表现形式,而同一数据也可能有不同的解释。
数据库
- 数据库(Database, DB)是长期存储在计算机内有组织的、可共享的大量数据集合。
- 数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
- 简而言之,数据库具有以下三个基本特点:永久存储、有组织、可共享。
数据库管理系统
- 数据库管理系统(Database Management System, DBMS)是位于用户和操作系统之间的数据管理软件。
- DBMS功能:科学地组织和存储数据、高效地获取和维护数据。
- DBMS是DBS的基础和核心。
数据库系统
- 数据库系统(Database System, DBS)是带有数据库的计算机应用系统。
- DBS的组成:数据库、数据库管理系统(及开发工具)、应用系统、数据库管理员(DBA)。(也可分为硬件、软件、人员)
1.2 数据管理技术的产生和发展
人工管理阶段(20世纪40年代中期–50年代中期)
- 特点:
- 不保存数据
- 应用程序自己管理自己的数据
- 数据不共享,冗余度大
- 程序与数据不独立,数据完全依赖于程序
文件系统管理阶段(20世纪50年代后期–60年代中期)
- 优点:
- 数据可以长期保存
- 文件系统管理数据
- 程序与数据之间有了一定的独立性
- 缺点:
- 数据共享性差,冗余度大
- 数据独立性差
数据库系统管理阶段(20世纪60年代中期以后)
- 数据库管理系统是数据管理技术发展的一个重大变革,从以程序设计为核心、数据服从程序设计的数据管理模式,改变为以数据库设计为核心、应用程序设计退居次位的数据管理模式。
新一代数据库系统
- 分布式数据库
- 空间数据库
- NoSQL数据库
- 面向对象数据库
- 信息存储与检索
- 数据挖掘与数据仓库
1.3 数据库系统的组成
- DBS包括应用程序、DBMS、数据库、用户、计算机硬件环境和操作系统。
- 应用程序、DBMS、数据库是DBS的最基本组成部分。
- 数据库系统的硬件
- 整个数据库系统对硬件资源的要求很高。
- 要有足够大的内存,用来存放操作系统、数据库管理系统、数据缓冲区和应用程序。
- 要有足够大的硬盘空间存放数据库,最好还要有足够的存放备份数据的磁盘。
- 数据库系统的软件
- DBMS
- OS
具有数据库访问接口的高级语言及其编程环境,以便于开发应用程序。 - 实用工具,以DBMS为核心,一般是数据库厂商提供的、随DBMS软件一起发行。
- 数据库系统中包含的人员
- DBA
- 系统分析人员
- 数据库设计人员
- 应用程序编写人员
- 最终用户
1.4 数据库系统的特点
数据结构化
- 数据库系统实现整体数据的结构化,这是数据库系统的主要特征之一,也是数据库系统与文件系统的本质区别。
- 整体结构化:
- 不再仅仅针对某一个应用,而是面向全组织;
- 不仅数据内部结构化,整体是结构化的,数据之间具有联系。
数据的共享性高,冗余度低,易扩充
- 数据共享的好处
- 减少数据冗余,节约存储空间
- 避免数据之间的不相容性和不一致性
- 使系统易于扩充
数据独立性高
- 数据独立性包括数据的物理独立性和数据逻辑独立性。
- 物理独立性
指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。 - 逻辑独立性
指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。 - 数据独立性是由DBMS的二级映像功能来保证的。
数据由DBMS统一管理和控制
- 数据库的共享是并发的共享,就是说多个用户可以同时存取数据库中的数据,甚至是同时存取同一个数据。
- DBMS提供以下数据控制功能:
- 数据的安全性(Security)保护
保护数据,以防止不合法的使用造成的数据的泄密和破坏。 - 数据的完整性(Integrity)检查
将数据控制在有效范围内,或保证数据间满足一定关系。 - 并发(Concurrency)控制
对多用户的并发操作加以控制和协调,以防止相互干扰而得到错误的结果。 - 数据库恢复(Recovery)
将数据库从错误状态恢复到某一已知的正确状态。
- 数据的安全性(Security)保护
数据项和记录
- 记录可以理解为行,一行称为一个记录,一行里面可能不是一个内容,比如表格有多个列,列就是数据项。 数据记录的和数据项的关系,简单来说就是表格中行与列的关系。
- 数据项是数据基本单元。
- 数据库的数据项之间和记录之间都存在联系