1.数据、信息、知识和决策
数据的概念:数据是描述事物的符号记录。数据的表现形式还不能完全表达它的内容,还需要通过解释获得数据的语义。数据与其语义是不可分的。
信息的概念:信息是对数据进行解释后的内容。
知识的概念:知识是对信息进行进一步的总结概括后所获得的信息。可以理解为知识是更高层次的信息。
知识与决策的关系:知识可以作为决策的基础。
2.数据库技术的产生与发展
数据库技术的产生:数据库技术是应数据管理任务的需要而产生的。
数据管理技术的发展过程:人工管理阶段、文件管理阶段、数据库系统阶段。
数据管理技术的发展动力:应用需求的推动、计算机硬件的发展、计算机软件的发展。
2.1.人工管理阶段
人工管理阶段的时期:人工管理阶段的时期位于20世纪50年代中期之前。
人工管理阶段的背景:人工管理阶段时数据的应用需求主要用于科学计算;硬件水平上没有直接存取的存储设备;软件水平上还没有操作系统,计算机的处理方式是批处理。
人工管理阶段的特点:数据的管理者是应用程序,数据不进行保存;一种数据只面向某一个应用程序;数据不共享,存在非常大的冗余;数据完全依赖程序;数据没有实现结构化,由应用程序自行控制自己的数据。最大的特点是一个数据集仅对应一个应用程序。
2.2.文件系统阶段
文件系统阶段的时期:文件系统阶段的时期位于20世纪50年代末-60年代中。
文件系统的产生背景:文件系统阶段的数据用于科学计算和数据管理;硬件上出现了磁盘和磁鼓;软件上出现了文件系统;计算机的处理方式由单一的批处理发展到批处理与联机实时处理相结合。
文件系统的特点:数据的管理者是文件系统,数据可以长期保存;数据面向的对象仍然是某一个应用程序;数据的共享性差,冗余度大;数据的记录内有结构但是整体无结构;数据的独立性差,如果数据的逻辑结构改变则需要修改应用程序;应用程序自行控制自己的数据。
2.3.数据库系统阶段
数据库系统阶段时期:数据库系统阶段开始于20世纪60年代末,并延续至今。
数据库系统产生背景:数据库系统阶段中的数据需要进行大规模管理;硬件上出现了大容量的磁盘和磁盘阵列技术;软件上出现了数据库管理系统;计算机的处理方式已经变为批处理、联机实时处理和分布处理相结合的方式。
数据库系统的意义:从文件系统到数据库系统,标志着数据管理技术的飞跃。
3.数据库系统的基本概念
3.1.数据
数据的定义:数据是描述事物的符号记录。数据是数据库中存储的基本对象。
数据的种类:数据包括文本、图形、图像、音频、视频等多种形式。
数据的特点:数据的含义成为数据的语义,数据于其语义是密不可分的。
3.2.数据库(DB)
数据库的定义:数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。
3.3.数据库管理系统(DBMS)
数据库管理系统定义:数据库管理系统是位于用于和操作系统之间的一层数据软件。数据库管理系统是一个基础软件,是一个大型复杂的软件系统。
数据库管理系统的功能概述:科学地组织和存储数据、高效地获取和维护数据。
数据库管理系统的主要功能:
①数据定义功能:DBMS提供数据定义语言,用于定义数据库中的数据对象。
②数据组织、存储和管理功能:DBMS可以分类组织、存储和管理各种数据,确定组织数据的文件结构和存取方式,实现数据之间的联系,并提供多种存取方法以提高数据存取效率。
③数据操纵功能:DBMS提供数据操纵语言,可以实现对数据库的基本操作(查询、插入、删除和修改)。
④数据库的事务管理和运行管理:DBMS可以保证数据的安全性、完整性和多用户对数据的并发使用,同时可以实现发生故障后的系统恢复。
⑤数据库的建立与维护:DBMS可以进行数据库初始数据的装载与转换,实现数据库的转储功能,以及数据库的重组织,还有数据库的性能监视分析等。
⑥其他功能:DBMS应该可以与网络中的其他软件系统之间进行通信,以及完成系统之间的数据转换,还有异构数据库之间的互访和互操作。
3.4.数据库系统(DBS)
数据库系统的定义:数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。
4.数据库系统的特点
4.1.数据结构化
数据的整体结构化是数据库的主要特征之一。数据库中的数据采用数据模型进行描述,而无需应用程序定义。
整体结构化的概念:数据不再仅仅针对某一个应用,而是面向全组织;不仅数据内部是结构化的,整体上也是结构化的,数据之间存在联系;数据记录可以变长;数据的最小存取单位是数据项。
4.2.数据的共享性高,冗余度低且易扩充
数据库系统从整体角度来看待和描述数据,数据面向整个系统,可以被多个用户以及多个应用共享使用。
数据共享的优点:数据共享可以减少数据冗余,节约存储空间;避免了数据之间的不相容性和不一致性;数据共享使得系统易于扩充。
4.3.数据独立性高
数据的独立性的分类:数据的独立性可以分为物理独立性和逻辑独立性。
物理独立性的定义:用户的应用程序与数据库中数据的物理存储是相互独立的。即使数据的物理存储发生了改变,应用程序也不需要进行修改。
逻辑独立性的定义:用户的应用程序与数据库的逻辑结构相互独立。数据的逻辑结构发生变化,应用程序也不需要进行修改。
数据独立性的实现:数据独立性由数据库管理系统的二级映像功能来实现。
4.4.数据由DBMS统一管理和控制
DBMS提供以下数据控制功能:
①数据的安全性保护:保护数据,防止不合法的使用造成的数据泄露和破坏。
②数据的完整性检查:保证数据的正确性、有效性和相容性。
③并发控制:对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
④数据库恢复:将数据库从错误状态恢复到某一已知的正确状态。