数据库期末复习笔记--王珊《数据库系统概论》

数据库

站在前人的肩膀上能走的更远,有些地方参考另一篇博客,链接放在最后了。其他知识均总结自王珊老师的《数据库系统概论》。通过本篇博客,能对数据库基础知识有个大致了解,更专业,更详细的知识还是查阅教材比较好。

基本概念

数据库是长期存储在计算机内、有组织的可共享和大量数据的集合。

数据库三个阶段:人工管理,文件系统,数据库系统

数据库有两个重要的模型:概念模型和数据模型。概念模型面向人,数据模型面向机器。

Data:数据,是数据库中存储的基本对象,是描述事物的符号记录。

Database:数据库,是长期储存在计算机内、有组织的、可共享的大量数据的集合。

DBMS:数据库管理系统,是位于用户与操作系统之间的一层数据管理软件,用于科学地组织、存储和管理数据、高效地获取和维护数据。

DBS:数据库系统,指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统、应用系统、数据库管理员(DBA)构成。

实体和属性:客观存在并可相互区别的事物称为实体。实体所具有的某一特性称为属性。

码:代表数目的符号(分有主码和候选码等)

主码:我们在建立数据库的时候,需要为每张表指定一个主码,主bai码也叫主键。所谓主码就是在实体集中区分不同实体的候选码。一个实体集中只能有一个主码,但可以有多个候选码。

**主属性:包含在任一候选关键字中的属性称主属性。**主码和候选码所包含的属性称为主属性。

非主属性:不包含在主码中的属性称为非主属性。 非主属性是相对与主属性来定义的。

**E-R图:**即实体-关系图,用于描述现实世界的事物及其相互关系,是数据库概念模型设计的主要工具。

型/值:型是对某一类数据的结构和属性的说明;值是型的一个具体赋值,是型的实例。

数据库模式:是对数据库中全体数据的逻辑结构(数据项的名字、类型、取值范围等)和特征(数据之间的联系以及数据有关的安全性、完整性要求)的描述。

数据库的三级系统结构:外模式、模式和内模式。

数据库内模式:又称为存储模式,是对数据库物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式。

数据库外模式:又称为子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图。通常是模式的子集。一个数据库可有多个外模式。

数据库的二级映像:外模式/模式映像、模式/内模式映像。

数据库系统由数据库、数据库管理系统、应用系统和数据库管理员构成。

实体型之间的联系分为一对一、一对多和多对多三种类型。

关系模型的完整性约束包括:实体完整性、参照完整性和用户定义完整性。

阐述数据库三级模式、二级映象的含义及作用。

数据库三级模式反映的是数据的三个抽象层次: 模式是对数据库中全体数据的逻辑结构和特征的描述。内模式又称为存储模式,是对数据库物理结构和存储方式的描述。外模式又称为子模式或用户模式,是对特定数据库用户相关的局部数据的逻辑结构和特征的描述。

数据库三级模式通过二级映象在 DBMS 内部实现这三个抽象层次的联系和转换。外模式面向应用程序, 通过外模式/模式映象与逻辑模式建立联系, 实现数据的逻辑独立性。 模式/内模式映象建立模式与内模式之间的一对一映射, 实现数据的物理独立性。

简答题

简述数据库系统的组成

数据库系统是由数据库、数据库管理系统、应用程序和数据库管理员组成的存储、管理、处理、和维护数据的系统。

简述数据库系统常见故障

数据库系统中可能发生的故障大致分以下几类:事务内部故障、系统故障、介质故障、计算机病毒。

简述使用ODBC技术有点

使用ODBC编写的应用程序可移植性好,能同时访问不同的数据库,共享多个数据库。

简述并发操作带来的数据不一致性

丢失修改、不可重复读、读脏数据

数据模型

数据模型是用来抽象、表示和处理现实世界中的数据和信息的工具,是对现实世界的模拟,**是数据库系统的核心和基础; ** 其组成元素有数据结构、数据操作和完整性约束。

根据模型的应用的不同目的,可以将这些模型划分为两大类,他们分别属于不同的层次。第一类是概念模型,第二类是逻辑模型和物理模型。

概念模型

概念模型,也称信息模型,是按用户的观点来对数据和信息建模,主要用于数据库设计。

逻辑模型和物理模型

逻辑模型:是按计算机系统的观点对数据建模,用于DBMS实现。

物理模型:是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。

常见的主要的数据模型有:

  • 层次模型
  • 网状模型
  • 关系模型
    • 面向对象数据模型
  • 对象关系数据模型
  • 半结构化数据模型

其中层次模型和网状模型统称为格式化模型。

层次模型

在数据库中定义满足下面两个条件的基本层次联系的集合称为层次模型:

  • 有且只有一个节点没有双亲节点,这个节点称为根节点
  • 根以外的其他节点有且只有一个双亲节点

层次模型类似数据结构中的二叉树

网状模型

在数据结构中,把满足以下两个条件的基本层次联系集合称为网状模型:

  • 允许一个以上的节点无双亲
  • 一个节点可以有多于一个的双亲

网状模型中一个节点可以有多个双亲,节点之间可以有多种联系。

关系模型

从用户观点看,关系模型是由一组关系组成,每个关系的数据结构是一张规范化的二维表。

关系模型中有很多术语:关系、元组、属性、码、域、分量、关系模式。

关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是, **关系的每一个分量都必须是一个不可分割的数据项。**关系模型具有以下优点:

  • 关系模型与格式化模型不同,它是建立在严格的数学概念的基础上的。
  • 关系模型的概念单一
  • 关系模型的存取路径对用户来说是透明的,从而有更高的数据独立性,安全性。但是降低了查询效率。

注意关系模型与关系模式的区别,关系模型包含关系模式。关系模式是对关系的描述,一般为:

关系名(属性1,属性2, 属性3,…,属性n)

下面是关系和生活中表格的术语对比

关系术语 一般表格术语
关系名 表名
关系模式 表头(表格的描述)
关系 (一张)二维表
元组 记录或行
属性
属性名 列名
属性值 列值
分量 一条记录中的一个列值
非规范关系 表中有表(大表嵌套小表)

关系代数

一、相关概念

主键: 能够唯一地标识一个元组的属性或属性组称为关系的键或候选键。 若一个关系有多个候选键则可选其一作为主键(Primary key)。

外键:如果一个关系的一个或一组属性引用(参照)了另一个关系的主键,则称这个或这组属性为外码或外键(Foreign key)。

关系数据库: 依照关系模型建立的数据库称为关系数据库。 它是在某个应用领域的所有关系的集合。

关系模式: 简单地说,关系模式就是对关系的型的定义, 包括关系的属性构成、各属性的数据类型、 属性间的依赖、 元组语义及完整性约束等。 关系是关系模式在某一时刻的状态或内容, 关系模型是型, 关系是值, 关系模型是静态的、 稳定的, 而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。

实体完整性:用于标识实体的唯一性。它要求基本关系必须要有一个能够标识元组唯一性的主键,主键不能为空,也不可取重复值。

参照完整性: 用于维护实体之间的引用关系。 它要求一个关系的外键要么为空, 要么取与被参照关系对应的主键值,即外键值必须是主键中已存在的值。

用户定义的完整性:就是针对某一具体应用的数据必须满足的语义约束。包括非空、 唯一和布尔条件约束三种情况。

二、重要知识点

关系数据库语言分为关系代数、关系演算和结构化查询语言三大类。

关系的 5 种基本操作是选择、投影、并、差、笛卡尔积。

关系模式是对关系的描述,五元组形式化表示为:R(U,D,DOM,F),其中

R —— 关系名
U —— 组成该关系的属性名集合
D —— 属性组 U 中属性所来自的域
DOM —— 属性向域的映象集合
F —— 属性间的数据依赖关系集合

笛卡尔乘积,选择和投影运算请翻阅王珊老师的《数据库系统概论》

SQL语句

一、相关概念

SQL:结构化查询语言的简称, 是关系数据库的标准语言。SQL 是一种通用的、 功能极强的关系数据库语言, 是对关系数据存取的标准接口, 也是不同数据库系统之间互操作的基础。集数据查询、数据操作、数据定义、和数据控制功能于一体。

数据定义:数据定义功能包括模式定义、表定义、视图和索引的定义。

嵌套查询:指将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询。

二、重要知识点

SQL 数据定义语句的操作对象有:模式、表、视图和索引。

SQL 数据定义语句的命令动词是:CREATE、DROP 和 ALTER。

RDBMS 中索引一般采用 B+树或 HASH 来实现。

索引可以分为唯一索引、非唯一索引和聚簇索引三种类型。

SQL 创建表语句的一般格式

create table <表名> (
	<列名> <数据类型> [<列级完整性约束],
    <列名> <数据类型> [<列级完整性约束],
    [表级完整性约束]
);

<数据类型>:数据库系统支持的各种数据类型,包括长度和精度。

列级完整性约束:针对单个列(本列)的完整性约束, 包括 PRIMARY KEY、 REFERENCES表名(列名)、UNIQUE、NOT NULL 等。

表级完整性约束:基于表中多列的约束,包括 PRIMARY KEY ( 列名列表) 、FOREIGN KEY REFERENCES 表名(列名) 等。

SQL 创建索引语句的一般格式

create [unique] [cluster] index <索引名> on <表名> (
	<列名列表>
);

UNIQUE:表示创建唯一索引,缺省为非唯一索引;

CLUSTER:表示创建聚簇索引,缺省为非聚簇索引;

<列名列表>:一个或逗号分隔的多个列名,每个列名后可跟 ASC 或 DESC,表示升/降序,缺省为升序。多列时则按为多级排序。

SQL 查询语句的一般格式

select [all | distinct] <算术表达式列表> from <表名或视图名列表>
[ WHERE <条件表达式 1> ]
[ GROUP BY <属性列表 1> [ HAVING <条件表达式 2 > ] ]
[ ORDER BY <属性列表 2> [ ASCDESC ] ]

ALL/DISTINCT: 缺省为 ALL, 即列出所有查询结果记录, 包括重复记录。 DISTINCT则对重复记录只列出一条。

算术表达式列表:一个或多个逗号分隔的算术表达式,表达式由常量(包括数字和字符串)、列名、函数和算术运算符构成。每个表达式后还可跟别名。也可用 *代表查询表中的所有列。

<表名或视图名列表>: 一个或多个逗号分隔的表或视图名。 表或视图名后可跟别名。

条件表达式 1:包含关系或逻辑运算符的表达式,代表查询条件。

条件表达式 2:包含关系或逻辑运算符的表达式,代表分组条件。

<属性列表 1>:一个或逗号分隔的多个列名。

<属性列表 2>: 一个或逗号分隔的多个列名, 每个列名后可跟 ASC 或 DESC, 表示升/降序,缺省为升序。

权限管理

一、相关概念和知识

触发器是用户定义在基本表上的一类由事件驱动的特殊过程。由服务器自动激活, 能执行更为复杂的检查和操作,具有更精细和更强大的数据控制能力。使用 CREATE TRIGGER 命令建立触发器。

计算机系统存在技术安全、管理安全和政策法律三类安全性问题。

TCSEC/TDI 标准由安全策略、责任、保证和文档四个方面内容构成。

常用存取控制方法包括自主存取控制(DAC)和强制存取控制(MAC)两种。

自主存取控制(DAC)的 SQL 语句包括 GRANT 和 REVOKE 两个。 用户权限由数据对象和操作类型两部分构成。

把对 Student 和 Course 表的全部权限授予所有用户。
GRANT ALL PRIVILIGES ON TABLE Student,Course TO PUBLIC ;

把对 Student 表的查询权和姓名修改权授予用户 U4。
GRANT SELECTUPDATE(Sname) ON TABLE Student TO U4;

把对 SC 表的插入权限授予 U5 用户,并允许他传播该权限。
GRANT INSERT ON TABLE SC TO U5 WITH GRANT OPTION;

把用户 U5 对 SC 表的 INSERT 权限收回,同时收回被他传播出去的授权。
REVOKE INSERT ON TABLE SC FROM U5 CASCADE;

创建一个角色 R1,并使其对 Student 表具有数据查询和更新权限。
CREATE ROLE R1;
GRANT SELECTUPDATE ON TABLE Student TO R1;

对修改 Student 表结构的操作进行审计
AUDIT ALTER ON Student ;

范式

一、相关概念和知识点

数据依赖:反映一个关系内部属性与属性之间的约束关系,是现实世界属性间相互联系的抽象,属于数据内在的性质和语义的体现。

规范化理论:是用来设计良好的关系模式的基本理论。它通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。

函数依赖:简单地说,对于关系模式的两个属性子集X和Y,若X的任一取值能唯一确定Y的值,则称Y函数依赖于X,记作X→Y。

非平凡函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,但Y!⊆X,则称X→Y为非平凡函数依赖;如果X→Y,但Y⊆X,则称X→Y为平凡函数依赖。

完全函数依赖:对于关系模式的两个属性子集X和Y,如果X→Y,并且对于X的任何一个真子集X’,都没有X’→Y,则称Y对X完全函数依赖。

范式:指符合某一种级别的关系模式的集合。在设计关系数据库时,根据满足依赖关系要求的不同定义为不同的范式。

规范化:指将一个低一级范式的关系模式,通过模式分解转换为若干个高一级范式的关系模式的集合的过程。

1NF:若关系模式的所有属性都是不可分的基本数据项,则该关系模式属于1NF。

2NF:1NF关系模式如果同时满足每一个非主属性完全函数依赖于码,则该关系模式属于2NF。

3NF:若关系模式的每一个非主属性既不部分依赖于码也不传递依赖于码,则该关系模式属于3NF。全码一定是3NF

BCNF:若一个关系模式的每一个决定因素都包含码,则该关系模式属于BCNF。消除了主属性对码的部分和传递函数依赖

第一范式(1NF)

消除重复列

第一范式(1NF)中数据库表的每一列都是不可分割的基本数据项。同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。 简而言之,第一范式就是无重复的列。

在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。

第二范式(2NF)

属性完全依赖于主键[消除部分子函数依赖]

满足第二范式(2NF)必须先满足第一范式(1NF)。

第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。

第二范式(2NF)要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体,新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。简而言之,第二范式就是属性完全依赖于主键。

第三范式(3NF)

属性不依赖于其它非主属性[消除传递依赖]

满足第三范式(3NF)必须先满足第二范式(2NF)。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。

例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性。

在这里插入图片描述

具体实例剖析
  下面列举一个学校的学生系统的实例,以示几个范式的应用。

   在设计数据库表结构之前,我们先确定一下要设计的内容包括那些。学号、学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话等信息。为了简单我们暂时只考虑这些字段信息。我们对于这些信息,说关心的问题有如下几个方面。

   1)学生有那些基本信息 
   2)学生选了那些课,成绩是什么 
   3)每个课的学分是多少 
   4)学生属于那个系,系的基本信息是什么。

   首先第一范式(1NF):数据库表中的字段都是单一属性的,不可再分。这个单一属性由基本类型构成,包括整型、实数、字符型、逻辑型、日期型等。在当前的任何关系数据库管理系统(DBMS)中,不允许你把数据库表的一列再分成二列或多列,因此做出的都是符合第一范式的数据库。 

   我们再考虑第二范式,把所有这些信息放到一个表中(学号,学生姓名、年龄、性别、课程、课程学分、系别、学科成绩,系办地址、系办电话)下面存在如下的依赖关系。 
   1)(学号)→ (姓名, 年龄,性别,系别,系办地址、系办电话) 
   2) (课程名称) → (学分) 
   3)(学号,课程)→ (学科成绩)
</
  • 7
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1 .试述数据、数据库数据库系统、数据库管理系统的概念。 答: ( l )数据( Data ) :描述事物的符号记录称为数据。数据的种类有数字、文字、图形、图像、声音、正文等。数据与其语义是不可分的。解析在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据。现代计算机能存储和处理的对象十分广泛,表示这些对象的数据也越来越复杂。数据与其语义是不可分的。 500 这个数字可以表示一件物品的价格是 500 元,也可以表示一个学术会议参加的人数有 500 人,还可以表示一袋奶粉重 500 克。 ( 2 )数据库( DataBase ,简称 DB ) :数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 ( 3 )数据库系统( DataBas 。 Sytem ,简称 DBS ) :数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。解析数据库系统和数据库是两个概念数据库系统是一个人一机系统,数据库数据库系统的一个组成部分。但是在日常工作中人们常常把数据库系统简称为数据库。希望读者能够从人们讲话或文章的上下文中区分“数据库系统”和“数据库”,不要引起混淆。 ( 4 )数据库管理系统( DataBase Management sytem ,简称 DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。 DBMS 的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。解析 DBMS 是一个大型的复杂的软件系统,是计算机中的基础软件。目前,专门研制 DBMS 的厂商及其研制的 DBMS 产品很多。著名的有美国 IBM 公司的 DBZ 关系数据库管理系统和 IMS 层次数据库管理系统、美国 Oracle 公司的 orade 关系数据库管理系统、 s 油 ase 公司的 s 油 ase 关系数据库管理系统、美国微软公司的 SQL Serve ,关系数据库管理系统等。 2 .使用数据库系统有什么好处? 答: 使用数据库系统的好处是由数据库管理系统的特点或优点决定的。使用数据库系统的好处很多,例如,可以大大提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担,等等。使用数据库系统可以大大提高应用开发的效率。因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径,这些工作都由 DBMS 来完成。用一个通俗的比喻,使用了 DBMS 就如有了一个好参谋、好助手,许多具体的技术工作都由这个助手来完成。开发人员就可以专注于应用逻辑的设计,而不必为数据管理的许许多多复杂的细节操心。还有,当应用逻辑改变,数据的逻辑结构也需要改变时,由于数据库系统提供了数据与程序之间的独立性,数据逻辑结构的改变是 DBA 的责任,开发人员不必修改应用程序,或者只需要修改很少的应用程序,从而既简化了应用程序的编制,又大大减少了应用程序的维护和修改。使用数据库系统可以减轻数据库系统管理人员维护系统的负担。因为 DBMS 在数据库建立、运用和维护时对数据库进行统一的管理和控制,包括数据的完整性、安全性、多用户并发控制、故障恢复等,都由 DBMS 执行。总之,使用数据库系统的优点是很多的,既便于数据的集中管理,控制数据冗余,提高数据的利用率和一致性,又有利于应用程序的开发和维护。读者可以在自己今后的工作中结合具体应用,认真加以体会和总结。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值