数据库原理及应用 1

绪论

1.1 数据库系统概述

1.1.1 基本概念

数据(Data):

描述事物的符号记录。

数据库中存储的基本对象。
数据的含义称为数据的语义,数据与其语义是不可分的。

数据库(Database, DB):

长期储存在计算机内有组织的、可共享大量数据的集合。

基本特征

▪ 数据按一定的数据模型组织、描述和储存

1)数据模型三要素
2)概念模型---->逻辑模型---->物理模型
3)层次模型、网状模型、关系模型

▪ 可为各种用户共享

1)安全性、完整性
2)并发控制
3)关系查询处理和查询优化

▪ 冗余度较小

1)规范化设计

▪ 数据独立性较高
▪ 易扩展

数据库管理系统(DBMS)

位于用户与操作系统之间的一层数据管理软件。

数据库系统的核心组成部分
用途:科学地组织和存储数据、高效地获取和维护数据

主要功能

数据定义功能(DDL)

提供数据定义语言(DDL) 定义数据库中的数据对象

数据组织、存储和管理 分类组织、存储和管理各种数据

确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率

数据操纵功能(DML)

提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改)

数据库的事务管理和运行管理(DCL)

数据库在建立、运行和维护时由DBMS统一管理和控制
数据库控制语言(DCL)
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复

数据库的建立和维护功能(实用程序)

数据库初始数据装载转换
数据库转储 介质故障恢复 数据库的重组织 性能监视分析等

其它功能

DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作

数据库系统(Database System,DBS)

在计算机系统中引入数据库后的系统构成。

数据库系统的构成 :
▪ 数据库
(操作系统)
▪ 数据库管理系统(及其开发工具) 
▪ 应用系统
(应用开发工具)
▪ 用户

1.1.2 数据库系统的特点

数据结构化

整体数据的结构化是数据库的主要特征之一。

整体结构化

▪ 不再仅仅针对某一个应用,而是面向全组织
▪ 不仅数据内部结构化,整体是结构化的,数据之间具有联系

数据库中实现的是数据的真正结构化

▪ 数据的结构用数据模型描述,无需程序定义和解释
▪ 数据可以变长
▪ 数据的最小存取单位是数据项

数据的共享性高,冗余度低,易扩充

数据库系统从整体角度看待和描述数据,数据面向整个系统,可以被多个用户、多个应用共享使用。
数据共享的好处

▪ 减少数据冗余,节约存储空间
▪ 避免数据之间的不相容性与不一致性
▪ 使系统易于扩充

数据独立性高

物理独立性

▪ 指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
当数据的物理存储改变了,应用程序不用改变。

逻辑独立性

▪ 指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。

数据独立性是由DBMS的二级映像功能来保证的

数据由DBMS统一管理和控制
DBMS提供的数据控制功能

▪ (1)数据的安全性(Security)保护 保护数据,以防止不合法的使用造成的数据的泄密和破坏。 ▪
(2)数据的完整性(Integrity)检查 将数据控制在有效的范围内,或保证数据之间满足一定的关系。 ▪
(3)并发(Concurrency)控制 对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。 ▪
(4)数据库恢复(Recovery) 将数据库从错误状态恢复到某一已知的正确状态。

1.2 数据模型的组成要素

1.2.1 数据结构

描述数据库的组成对象,以及对象之间的联系。

(1)与数据类型、内容、性质有关的对象;
(2)与数据之间联系有关的对象。
数据结构是对系统静态特性的描述。

1.2.2 数据操作

对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则。

  • 数据操作的类型:
    ▪查询
    ▪更新(包括插入、删除、修改)
  • 数据模型对操作的定义:
    ▪ 操作的确切含义
    ▪ 操作符号
    ▪ 操作规则(如优先级)
    ▪ 实现操作的语言

数据操作是对系统动态特性的描述。

1.2.3 数据的完整性约束条件

一组完整性规则的集合。

完整性规则:
• 给定的数据模型中数据及其联系所具有的制约和储存规则
•用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。

  • 数据模型对完整性约束条件的定义
    ▪ 反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。
    ▪ 提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。

1.3 数据模型

数据库中用数据模型来抽象、表示和处理现实世界中的数据和信息。

数据库系统、数据定义和数据操纵语言的核心和基础

基本概念

信息世界

(1)实体(Entity):客观存在并且可以相互区别的“事物”。
(2)属性(Attribute):实体所具有的某一特性。
(3)实体型(Entity type):用实体名及其属性名来抽象和描述同类实体。
(4)实体集(Entity set):同型实体的集合。
(5)(关键)码/键(Key):在实体型中唯一能标识一个实体的属性或属性集。
(6)域(Domain):属性的取值范围。

(7)联系(Relationship)
反映实体型及其联系的结构形式称为实体(信息)模型。

  • 实体型内部的联系:组成实体的各属性之间的联系。
  • 实体型之间的联系:不同实体集之间的联系。
  1. 一对一联系(1:1)
  2. 一对多联系(1:N)
  3. 多对多联系(N:N)
计算机世界

(1)字段/数据项(Field):标记实体属性的命名单位,命名往往与属性名相同。
(2)记录(Record):字段的有序集合;能完整描述一个实体的字段集。
(3)文件(File):同一类记录的集合,用来描述实体集。
(4)关键字(Key):能唯一标识文件中每个记录的字段或字段集。

现实世界---->信息世界---->计算机世界
事物总体---->实体集 ---->文件
事物个体---->实体 ---->记录
特征 ---->属性 ---->字段
事物之间的联系---->实体模型---->数据模型

分类

概念模型(信息模型)

按用户的观点来对数据和信息建模,是对现实世界事物及其联系的第一级抽象。用于数据库设计。

实体联系(E-R)模型

实体型
用矩形表示,矩形框内写明实体名。

属性
用椭圆形表示,并用无向边将其与相应的实体连接起来

联系:
用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)

  • 联系的属性:
    联系本身也是一种实体型,也
    可以有属性。如果一个联系具
    有属性,则这些属性也要用无
    向边与该联系连接起来。
逻辑模型

按计算机系统的观点对数据建模,用于DBMS实现。

非关系模型

▪ 层次模型(Hierarchical Model)
层次模型用树形结构来表示各类实体以及实体间的联系。

满足下面两个条件的基本层次联系的集合为层次模型:

  1. 有且只有一个结点没有双亲结点,这个结点称为根结点
  2. 根以外的其它结点有且只有一个双亲结点

在这里插入图片描述

层次模型的特点: ▪ 结点的双亲是唯一的 ▪ 只能直接处理一对多的实体联系 ▪ 每个记录类型可以定义一个排序字段,也称为码字段 ▪
任何记录值只有按其路径查看时,才能显出它的全部意义 ▪ 没有一个子女记录值能够脱离双亲记录值而独立存在

多对多联系在层次模型中的表示: 用层次模型间接表示多对多联系。
方法:将多对多联系分解成一对多联系。
• 冗余结点法
• 虚拟结点法

层次模型的数据操纵:
▪查询
▪插入
▪删除
▪更新

层次模型的完整性约束条件:
▪ 无相应的双亲结点值就不能插入子女结点值;
▪ 如果删除双亲结点值,则相应的子女结点值也被同时删除;
▪ 更新操作时,应更新所有相应记录,以保证数据的一致性。

层次数据模型的存储结构
邻接法:
按照层次树前序遍历的顺序把所有记录值依次邻接存放,即通过物理空间的位置相邻来实现层次顺序
链接法:
用指针来反映数据之间的层次联系。

子女-兄弟链接法:每个记录设两类指针,分别指向最左边的子女(每个记录型对应一个)和最近的兄弟。

层次序列链接法:按树的前序穿越顺序链接各记录值。

优点

▪ 层次模型的数据结构比较简单清晰
▪ 查询效率高,性能优于关系模型,不低于网状模型 ▪ 层次数据模型提供了良好的完整性支持

缺点

▪ 多对多联系表示不自然
▪ 对插入和删除操作的限制多,应用程序的编写比较 复杂
▪ 查询子女结点必须通过双亲结点
▪ 由于结构严密,层次命令趋于程序化

▪ 网状模型(Network Model)

满足下面两个条件的基本层次联系的集合:

  1. 允许一个以上的结点无双亲;
  2. 一个结点可以有多于一个的双亲。
  • 数据结构

表示方法(与层次数据模型相同)
实体型:用记录类型描述
每个结点表示一个记录类型(实体)
属性:用字段描述
每个记录类型可包含若干个字段
联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系

网状模型中子女结点与双亲结点的联系可以不唯一。
要为每个联系命名,并指出与该联系有关的双亲记录和子女记录。

在这里插入图片描述

多对多联系在网状模型中的表示:
▪ 用网状模型间接表示多对多联系
▪ 方法:
将多对多联系直接分解成一对多联系

操纵与完整性约束
网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束
▪ 码:唯一标识记录的数据项的集合
▪一个联系中双亲记录与子女记录之间是一对多联系
▪ 支持双亲记录和子女记录之间某些约束条件

存储结构
关键:
▪ 实现记录之间的联系
常用方法:
▪ 单向链接 ▪ 双向链接 ▪ 环状链接 ▪ 向首链接

优点
▪ 能够更为直接地描述现实世界,如一个结点可以有多个双亲
▪ 具有良好的性能,存取效率较高
缺点
▪结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
▪ DDL、DML语言复杂,用户不容易使用

关系模型(Relational Model)

数据结构

▪ 关系(Relation)
一个关系对应通常说的一张表
▪ 元组(Tuple)
表中的一行即为一个元组
▪ 属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名。
▪ 主码(Key)
表中的某个属性组,它可以唯一确定一个元组。
▪ 域(Domain)
属性的取值范围。
▪分量
元组中的一个属性值。
▪ 关系模式
对关系的描述:
关系名(属性1,属性2,…,属性n)

关系必须是规范化的,满足一定的规范条件

最基本的规范条件:

关系的每一个分量必须是一个不可分的数据项, 不允许表中还有表

在这里插入图片描述

操作

▪ 查询 ▪ 插入 ▪ 删除 ▪ 更新
数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合
存取路径对用户隐蔽

关系的完整性约束条件

▪ 实体完整性
▪ 参照完整性
▪ 用户定义的完整性

面向对象模型(Object Oriented Model)
对象关系模型(Object Relational Model)

存储结构:
实体及实体间的联系都用表来表示
表以文件形式存储

优点
▪ 建立在严格的数学概念的基础上
▪ 概念单一
• 实体和各类联系都用关系来表示 • 对数据的检索结果也是关系
▪ 关系模型的存取路径对用户透明
• 具有更高的数据独立性,更好的安全保密性
• 简化了程序员的工作和数据库开发建立的工作
缺点
▪ 存取路径对用户透明导致查询效率往往不如非
关系数据模型
▪ 为提高性能,必须对用户的查询请求进行优化
增加了开发DBMS的难度

物理模型

对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。

1.4 数据库系统结构

从数据库管理系统角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构。

基本概念
型(Type) 
对某一类数据的结构和属性的说明
值(Value) 
型的一个具体赋值


 模式(Schema)
    ▪ 数据库逻辑结构和特征的描述 
    ▪ 是型的描述
    ▪ 反映的是数据的结构及其联系 
    ▪ 模式是相对稳定的
  

 实例(Instance)
       ▪ 模式的一个具体值
       ▪ 反映数据库某一时刻的状态
       ▪ 同一个模式可以有很多实例
       ▪ 实例随数据库中的数据的更新而变动

数据库系统的三级模式结构

模式(Schema)
(逻辑模式)
 ▪ 数据库中全体数据的逻辑结构和特征的描述
 ▪ 所有用户的公共数据视图,综合了所有用户的需求

一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
▪ 与数据的物理存储细节和硬件环境无关
▪ 与具体的应用程序、开发工具及高级程序设计语言无关

模式的定义
▪ 数据的逻辑结构(数据项的名字、类型、取值范围等)
▪ 数据之间的联系
▪ 数据有关的安全性、完整性要求

外模式(External Schema)

(子模式或用户模式)
>     ▪ 数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
>     ▪ 数据库用户的数据视图,是与某一应用有关的数据的逻辑表示

外模式的地位:介于模式与应用之间
外模式的用途:
◼ 保证数据库安全性的一个有力措施
◼ 每个用户只能看见和访问所对应的外模式中的数据

 ▪ 模式与外模式的关系:一对多
➢ 外模式通常是模式的子集
➢ 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
➢ 对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
▪ 外模式与应用的关系:一对多
➢ 同一外模式也可以为某一用户的多个应用系统所使用 ➢ 但一个应用程序只能使用一个外模式

内模式(Internal Schema)

 (存储模式)
 ▪ 是数据物理结构和存储方式的描述 
 ▪ 是数据在数据库内部的表示方式 

• 记录的存储方式(顺序存储,按照B树结构存储,按hash方法存储)
• 索引的组织方式
• 数据是否压缩存储
• 数据是否加密
• 数据存储记录结构的规定
一个数据库只有一个内模式

在这里插入图片描述

二级映像功能与数据独立性

三级模式是对数据的三个抽象级别---->二级映象在DBMS内部实现这三个抽象层次的联系和转换。
外模式/模式映象
  • 模式:描述的是数据的全局逻辑结构
  • 外模式:描述的是数据的局部逻辑结构
  • 同一个模式可以有任意多个外模式
  • 每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
  • 映象定义通常包含在各自外模式的描述中

保证数据的逻辑独立性:
▪ 当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变
▪应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

模式/内模式映象
  • 模式/内模式映象定义了数据全局逻辑结构与存储结 构之间的对应关系。
    ▪ 例如,说明逻辑记录和字段在内部是如何表示的
  • 数据库中模式/内模式映象是唯一的
  • 该映象定义通常包含在模式描述中

保证数据的物理独立性:
▪ 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变
▪ 应用程序不受影响。保证了数据与程序的物理独立性, 简称数据的物理独立性。

在这里插入图片描述

数据库模式
▪ 即全局逻辑结构是数据库的中心与关键
▪ 独立于数据库的其他层次
▪ 设计数据库模式结构时应首先确定数据库的逻辑模式

数据库的内模式
▪ 依赖于它的全局逻辑结构
▪ 独立于数据库的用户视图,即外模式
▪ 独立于具体的存储设备
▪ 将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率

数据库的外模式
▪ 面向具体的应用程序
▪ 定义在逻辑模式之上
▪ 独立于存储模式和存储设备
▪ 当应用需求发生较大变化,相应外模式不能满足其视图要求 时,该外模式就得做相应改动
▪ 设计外模式时应充分考虑到应用的扩充性

特定的应用程序
▪ 在外模式描述的数据结构上编制的
▪ 依赖于特定的外模式
▪ 与数据库的模式和存储结构独立
▪ 不同的应用程序有时可以共用同一个外模式
数据库的二级映像
▪ 保证了数据库外模式的稳定性
▪ 从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改

数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去

数据的存取由DBMS管理
▪ 用户不必考虑存取路径等细节 ▪ 简化了应用程序的编制
▪ 大大减少了应用程序的维护和修改

在这里插入图片描述

数据库管理员(DBA)
具体职责: 
1. 决定数据库中的信息内容和结构
2. 决定数据库的存储结构和存取策略 
3. 定义数据的安全性要求和完整性约束条件
4. 监控数据库的使用和运行
 ▪ 周期性转储数据库 • 数据文件• 日志文件
 ▪ 系统故障恢复 ▪ 介质故障恢复 ▪ 监视审计文件
 5. 数据库的改进和重组 
 ▪ 性能监控和调优▪ 定期对数据库进行重组织,以提高系统的性能 ▪ 需求增加和改变时,数据库须需要重构造


系统分析员
▪ 负责应用系统的需求分析和规范说明
▪ 与用户及DBA协商,确定系统的硬软件配置 ▪ 参与数据库系统的概要设计

数据库设计人员
▪ 参加用户需求调查和系统分析 ▪ 确定数据库中的数据
▪ 设计数据库各级模式

用户 
用户是指最终用户(End User)。最终用户通过应用系统的用户接口使用数据库。
1. 偶然用户
2. 简单用户 
3. 复杂用户
实验1 数据库及数据定义 1、创建一个名为XSCJ的数据库,其初始大小为5MB,最大大小10MB,允许数据库自动增长,增长方式是按10%比例增长;日志文件初始为2MB,最大可增长到5MB,按1MB增长。 2、将以上XSCJ数据库的主数据文件的最大大小改为不限制。 3、参照教材82页例3.5、例3.6、例3.7分别建立Student表、Course表和SC表,并录入数据库表中相应元组。 4、分别采用SQL编程模式和设计模式修改Course表,为其增加一列开课学期,数据类型自行定义。 5、为Course表的Cname列建立一个唯一索引,索引名Cname_idx。 6、分离数据库XSCJ并拷贝文件至U盘保存好,用于下次实验;然后再将其附加上。 7、删除唯一索引Cname_idx。 8、删除基本表Student。 实验2 数据查询 将上次实验课的学生成绩数据库(XSCJ)附加到SQL SERVER中,录入数据后做如下查询。 1) 查询选修了课程的学生的学号; 2) 查询全体学生的姓名和出生年份,并将列别名改为XM和CSNF; 3) 查询年龄在18到20(包括18岁和20岁)之间学生的学号、姓名和系。 4) 查询信息系(IS)、数学系(MA)和计算机科学系(CS)学生的姓名和性别。 5) 用LIKE查询课程名为DB_ S的课程号和学分。 6) 查所有有成绩的学生学号和课程号。 7) 查询全体学生情况,查询结果按所在系的系号升序排列,同一系中的学生按年龄升序排列 8) 查询选修了课程的学生人数。 9) 计算1号课程的学生平均成绩。 10) 查询有2人以上(含2人)同学选修课程的课程号。 11) 查询1号课程的间接先修课。 12) 查询每个学生的学号、姓名、选修的课程名及成绩。 13) 找出每个学生高于他选修课程平均成绩的课程号。 实验3 数据更新和视图 将学生成绩数据库(XSCJ)附加到SQL SERVER中,完成如下实验任务。 1) 将一个新学生元组(学号:95007;姓名:张娜丽;性别:女;所在系:IS;年龄:18岁)插入到Student表中。 2) 插入一条选课记录,插入一条选课记录( '95007','1 ')。 3) 对每一个系,求学生的平均成绩,并把结果存入数据库。 (建立一张表,然后通过子查询将结果插入表中。) 4)将全体学生的年龄增加一岁。 5)将信息系全体学生的成绩置零。 6)删除95001学生的记录。 7)删除信息系所有学生的选课记录。 8)建立计算机学生的视图CS_S。(视图中包括学号,姓名,年龄,系),并要求进行修改和插入操作时仍需保证该视图只有计算机系的学生。(视图中包含的属性名称自拟) 9)向CS_S视图中插入分别插入两条信息,如果不能插入说明原因。 (学号:95002;姓名:李华华;所在系:IS;年龄:18岁) (学号:95003;姓名:王冬冬;所在系:CS;年龄:20岁) 10)利用CS_S视图完成以下查询。 查询计算机学生年龄小于20岁的学生(学号、年龄) 查询计算机系选修了2号课程的学生(学号、姓名)。 实验4 数据库的安全性 实验内容 将学生成绩数据库(XSCJ)附加到SQL SERVER中,完成如下实验任务。 (1)在SQL Server Management Studio中创建三个登录帐户:log1、log2、log3。 (2)利用前面建立的XSCJ数据库,用log1登录,能否操作XSCJ数据库?为什么? (3)将log1、log2、log3映射为XSCJ数据库中的用户。 注意:此映射步骤会为登陆名log1在XSCJ中自动建立同名数据库用户log1。log2和log3同理。 (4)用log1登录,能否访问XSCJ数据库?为什么? (5)授予log1、log2、log3具有对Student、Course、SC三张表的查询权。并且log1有权将查询SC表的权限授予其他用户。 (6)分别用log1、log2、log3登录,对上述三张表执行查询。 (7)分别用log1、log2登陆,在查询分析器中执行以下语句,用来授予log3 对SC表的访问权限,会出现什么情况? 实验5 数据库的完整性 将学生成绩数据库(XSCJ)附加到SQL SERVER中,完成如下实验任务。 (1)录入或变更数据,验证所建立的实体完整性规则及其违约处理。 (2)录入或变更数据,验证所建立的参照完整性规则及其违约处理。 (3)自行设定某些列,使得其不允许取空值。 (4)自行设定某些列,使得该列值不允许重复。 (5)自行设定某些列的默认值。 (6)用Check短语限定考试成绩的取值范围在0到100之间。 (7)为Student表设计一个触发器,使得新增一个学生时,自动为其分配一个学号。 实验6 数据库编程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值