第一章 绪论
数据库的4个基本概念
数据:是数据库中存储的基本对象。描述事物的符号记录称为数据。数据的含义称为数据的语义,数据与语义是不可分的。
数据库:数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
概括地讲,数据库数据具有永久存储、有组织和可共享三个基本特点。
数据库管理系统:数据库管理系统是位于用户与操作系统之间的一层数据管理软件。数据库管理系统和操作系统一样是计算机的基础软件,主要功能如下:
(1)数据定义功能
(2)数据组织、存储和管理
(3)数据操纵功能
(4)数据库的事务管理和运行管理
(5)数据库的建立和维护功能
(6)其他功能
数据库系统:数据库系统是由数据库,数据库管理系统、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。有以下特点:
(1)数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。所谓“整体”结构化实质数据库中的数据不再仅仅针对某一个应用,而是面向整个组织或企业;不仅数据内部是结构化的,而且整体是结构化的,数据之间是具有联系的。
(2)数据的共享性高、冗余度低且易扩充:数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。还使得数据库系统弹性大,易于扩充。
(3)数据独立性高。数据独立性分为物理独立性和逻辑独立性。物理独立性是指用户的应用程序与数据库的物理存储是相互独立的。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。
(4)数据由数据库管理系统统一管理和控制
在一般不引起混淆的情况下,人们常常把数据库系统简称为数据库。
综上所述,数据库是长期存储在计算机内有组织、大量、共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
数据模型
模型是对现实世界某个对象特征的模拟和抽象。数据模型是对现实世界数据特征的抽象。数据模型是用来描述数据、组织数据和对数据进行操作的。数据模型是数据库系统的核心和基础。数据模型分为两类:概念模型和物理模型。
概念模型
概念模型实际上是现实世界到机器世界的一个中间层次。
信息世界涉及到的相关概念:
(1)实体:客观存在并可相互区别的事物称为实体。
(2)属性:实体所具有的某一特征称为属性。
(3)码:唯一标识实体的属性集称为码。
(4)实体型:用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。
(5)实体集:同一类型实体的集合称为实体集。
(6)联系:实体内部的联系通常是指组成实体的各属性之间的联系,实体之间的联系通常是指不同实体集之间的联系。
实体之间的联系有一对一、一对多和多对多等多种类型。
概念模型的一种表示方法:实体—联系模型(E—R模型)
数据模型的组成要素
通常由数据结构、数据操作和数据的完整性约束条件三部分组成。
(1)数据结构:描述数据库的组成对象以及对象之间的联系。
(2)数据操作:是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。
(3)数据的完整性约束:是一组完整性规则。
层次模型
最早出现。用树形结构来表示各类实体以及实体间的联系。如行政机构、家族关系等。需满足:
(1)有且只有一个结点没有双亲结点,这个结点称为根节点。
(2)根以外的其他结点有且只有一个双亲结点。
优点:
(1)数据结构简单清晰
(2)数据库的查询效率高
(3)提供了良好的完整性支持
缺点:
(1)现实世界的很多联系不适合用这个模型
(2)结构严密,命令趋于程序化
(3)查询子女结点必须通过双亲结点
网状模型
需满足以下两个条件的基本层次联系集合:
(1)允许一个以上的结点无双亲
(2)一个结点可以有多于一个的双亲。
优点:
(1)能够更为直接地描述现实世界
(2)具有良好的性能,存取效率较高
缺点:
(1)结构比较复杂
(2)加重了用户编写应用程序的负担
关系模型
每个关系的数据结构是一张规范化的二维表。相关术语:
关系:一个关系对应通常说的一张表
元组:表中的一行即为一个元组
属性:表中的一列即为一个属性,属性的名称称为属性名
码:也称为码键。表中的某个属性,可以唯一确定一个元组,该属性就是本关系的码
域:一组具有相同数据类型的值的集合。属性的取值范围来自某个域
分量:元组中的一个属性值
三级模式结构
是指数据库系统是由外模式、模式和内模式三级构成。
模式:也称逻辑模式,时数据库中全体数据的逻辑结构和特征的描述,时所有用户的公共数据视图。
外模式:也称子模式或用户模式,时数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。
内模式:也称存储模式,一个数据库只有一个内模式。是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
二级映像功能与数据独立性
1.外模式/模式映像
当模式改变时(例如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式 /模式的映像作相应改变,可以使外式保持不变,应用程序是依据数据的外模式编写的,从而应用程序不必修改,徐证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
2.模式/内模式映像
当数据库的存储结构改变时(例如选用了另一种存储结构),由数据库管理员对模式 /内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性简称数据的物理独立性。
数据库系统的组成
1.硬件平台及数据库
2.软件
3.人员
第三章 关系数据库标准语言SQL
SQL:结构化查询语言
特点:
1.综合统一
2.高度非过程化
3.面向集合的操作方式
4.以同一种语法结构提供多种使用方式
5.语言简洁,易学易用
第四章 数据库安全性
数据库的安全性是指保护数据库以防止不合法使用所造成的数据泄露、更改或破坏。
对数据库安全性产生威胁的因素:
1.非授权用户对数据库的恶意存取和破坏
2.数据库中重要或敏感的数据被泄露
3.安全环境的脆弱性
数据加密方式:存储加密,传输加密
其他安全性保护:推理控制,隐蔽信道,数据隐私保护、视图技术、审计技术等等
第五章 数据库完整性
数据库的完整性是指数据的正确性和相容性。
正确性是指数据是符合现实世界语义、反映当前实际状况的;
相容性是指数据库同一对象在不同关系中的数据是符合逻辑的。
为维护数据库的完整性,DBMS必须能够实现如下功能:
1.提供定义完整性约束条件的机制
2.提供完整性检查的方法
3.进行违约处理
三类完整性:实体完整性、参照完整性、用户定义完整性
第六章 关系数据理论
一个关系模式应当是五元组:R(U,D,DOM,F)
本章中看作一个三元组:R(U,D,F),当且仅当U上的一个关系r满足F时,r称为关系模式R<U,F>的一个关系。
每一个分量 必须是不可分的数据项。满足了这个条件的关系模式就属于第一范式(1NF)。
数据依赖是一个关系内部属性和属性之间的一种约束关系。常用的有函数依赖和多值依赖。
若R∈1NF,且每一个非主属性完全函数依赖于任何一个候选码,则R属于2NF。
若R属于3NF,则每一个非主属性既不传递依赖于码,也不部分依赖于码。
若每一个决定因素都包含码,则R<U,F>∈BCNF。
关系模式R<U,F>∈1NF,如果对于R的每个非平凡函数依赖的多值依赖X—>—>Y(YX),X都含有码,则称R<U,F>∈4NF。
第七章 数据库设计
数据库设计是指对于一个给定的应用环境,构造(设计)优化的数据库逻辑模式和物理结构,并据此建立数据库及其应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求。
数据库设计的特点:
1.数据库建设的基本规律:“三分技术,七分管理,十二分基础数据”。
2.结构(数据)设计和行为(处理)设计相结合
数据库设计方法:新奥尔良方法、基于E—R模型的设计方法、3NF的设计方法、面向对象的数据库设计方法、统一建模语言方法等。
设计数据库的基本步骤:
1. 需求分析阶段
进行数据库设计首先必须准确了解与分析用户需求(包括数据与处理)。需求分析是整个设计过程的基础,是最困难和最耗费时间的一步。作为“地基”的需求分析是否做得充分与准确,决定了在其上构建数据库“大厦”的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。
2.概念结构设计阶段
概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合、归纳与抽象,形成一个独立于具体数据库管理系统的概念模型。
3.逻辑结构设计阶段
逻辑结构设计是将概念结构转换为某个数据库管理系统所支持的数据模型,并对其进行优化。
4.物理结构设计阶段
物理结构设计是为逻辑数据模型选取一个最适合应用环境的物理结构 (包括存储结构和存取方法)。
5.数据库实施阶段
在数据库实施阶段,设计人员运用数据库管理系统提供的数据库语言及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编写与调试应用程序,组织数据入库,并进行试运行。
6.数据库运行和维护阶段
数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评估、调整与修改。
需求分析的任务
调查的重点是“数据”和“处理”,通过调查、收集与分析,获得用户对数据库的如下要求:
(1)信息要求
(2)处理要求
(3)安全性与完整性要求
第十章 数据库恢复技术
事务:是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。
事物的ACID特性:
原子性(Atomicity)
一致性(Consisitency)
隔离性(Isolation)
持续性(Durability)
故障的种类:
1.事物内部的故障
2.系统故障
3.介质故障
4.计算机病毒
恢复的实现技术:数据转存和登记文件日志
第十一章 并发控制
事务是并发控制的基本单位。
并发操作带来的数据不一致性包括丢失数据、不可重复读、读“脏”数据。
封锁:排他锁(X锁、写锁)、共享锁(S锁、读锁)
封锁协议:有三级
死锁的预防:一次封锁法、顺序封锁法
死锁的诊断与解除:超时法、等待图法
封锁粒度:封锁对象的大小,与系统的并发度和并发控制的开销有关
两种多粒度封锁:显示封锁、隐式封锁
意向锁:如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁;对任一结点加锁时,必须先对它的上层结点加意向锁。
写在最后
花开堪折直须折,莫待无花空折枝。——《金缕衣》
作者一直在为成为一名优秀的写者而努力,希望对大家有一点小小的帮助~
非常感谢您能看到这里,荣幸至极。