《数据库原理与应用》复习总结-转

《数据库原理与应用》复习总结


数据库技术就是主要研究如何科学的组织和存储数据,高效的获取和处理数据,并可以满足用户各种不同的信息需求的技术,因为对数据库技术的需求非常大,所以学习这门课的知识和技术是非常必要的,应熟练弄清,掌握数据,数据管理,数据库,数据模型概念模型的等专业术语的内涵。




第1章 绪论

1.掌握数据库、数据库管理系统、数据库系统(组成)的概念

2.了解数据库技术发展的三个阶段

3.掌握三级模式及二级映像的概念

4.理解数据库管理系统的主要功能


知识点:

1.基本概念

数据数据库系统研究和处理的对象,反映客观世界的事实,并可以区分其特征的符号:字符、数字、文本、声音、图形、图像、图表、图片等,它们是现实世界中客观存在的,可以输入到计算机中进行存储和管理的。有以下四个特征:

1:数据有“值”和“型"之分. ”值“指的是数据的具体数值,”型“指的是数据的结构。

2:数据受取值范围和类型的约束。

3:有定性表示和定量表示之分。

4:具有载体和多种表现形式。


数据库:长期存储在计算机内,有组织的,可共享,统一管理的数据集合,是一个按照数据结构来存储数据的计算机软件系统。

1:保管数据的仓库,数据管理新的方法和技术,能更合理的组织数据,更方便更合理的维护,控制,利用数据。

一个数据的集合的特点:

1:最小的冗余度。

2:应用程序对数据资源共享。

3:数据独立性高。

4:统一管理和控制


数据库管理系统(DBMS):位于用户和计算机操作系统之间的提供数据管理的软件。


数据库系统:

包含计算机硬件,数据库,数据库管理系统,应用程序系统及数据库管理员,带有数据库并利用数据库技术进行数据库管理的计算机系统。

数据库系统相对于文件系统具有以下特点:

1:数据的结构化

2:数据库系统的数据冗余度小,数据共享度高

3:数据库系统的数据和程序之间具有较高的独立性

4:数据库中数据的最小存取单位是数据项。

5:统一的数据管理和控制

6:提供数据库保护


· 信息(Information):
由原始数据经加工提炼而成的、用于决定行为、计划或具有一定语义的数据称为信息。 
· 数据仓库(Data Warehouse)
一个数据仓库就是一个自带数据库的商业应用系统。利用现有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,创造出效益。 
· 数据发掘(Data Mining)
数据发掘可帮助商业用户处理大量存在的数据,以期发现一些"意外的关系",以便增加市场份额和利润。
· 信息发掘(Information Mining):
信息发掘是指在文档、地图、照片、声音和影像之汪洋大海中发现相关信息,即面向内容的检索。
· 字段( Field):
层次数据模型中数据的最小单位,描述实体的属性。
· 片段(Segment):
是IMS层次数据模型中描述实体的单位,由字段集合组成的记录。也是应用程序访问数据库数据的单位。
· 数据项(Data Item):
是DBTG命名的网状数据模型中的最小数据单位, 表示实体的属性。
· 记录(Record ):
是DBTG命名的网状数据模型中描述实体的单位,是数据项的有序集合。

· 域(Domain):
域是值的集合,即值的取值范围。
· 关系(Relation):
一个关系就是一张二维表, 每张表有一个表名。
· 元组(Tuple):
关系表中的一行称为一个元组。元组可表示一个实体或实体之间的联系。
· 属性( Attribute):
关系表中的一个列称为关系 的一个属性,即元组的一个数据项。属性有属性名、属性类型、属性值域和属性值之分。属性名在表中是唯一的。

· 关键字( Primary Key ):
表中的一个属性或几个属性的组合、其值能唯一地标识关系中的一个元组。关键字属性不能取空值。
· 外部关键字(Forgien Key):
在一个关系中含有的与另一个关系的关键字相对应的属性组称为该关系的外部关键字。外部关键字取空值或为外部表中对应的关键字值。
· 网络库(Net-Library):
一个通信软件包,对数据库请求和结果打包,由网络协议传送。也称Net-Library,在客户机和服务器上都要安装。


2.发展阶段

人工管理阶段---》文件系统阶段----》数据库阶段


3.三级模式和两级映像

数据库系统体系结构:三级模式(外模式、概念模式和内模式;视图层、逻辑层和物理层)和两级映像(保证数据较高的逻辑独立性和物理独立性)结构


4.DBMS的主要功能对数据库实现统一的管理和控制,用户可以通过DBMS访问数据库的内容,数据库管理员可以通过DBMS维护数据

主要功能:

1:数据定义能力:由数据库定义语言(DLL),实现定义功能。

2:数据操纵能力:DBMS提供数据操作语言DML(Data Manipulation Language),供用户实现对数据的追加、删除、更新、查询等操作。

3:数据库的组织、存储与管理:DBMS要分类组织、存储和管理各种数据,包括数据字典、用户数据、存取路径等。

4:数据库的建立及维护功能:

数据库的恢复(面对事务内部故障、系统故障、介质故障和计算机病毒等,建立物理级的冗余)

数据库的并发控制(不一致性:丢失更新、不可重复读、读脏数据)

数据库的完整性控制(包括正确性和相容性,防止加入不合法数据)

数据库安全性控制(进行用户权限管理)、

数据库的数据载入、转换、转储、数据库的重组合重构以及性能监控等功能



第2章 数据建模

1.掌握实体联系模型(E-R图)的表示方法,包括实体、属性、联系及联系类型。

2.理解数据模型的三要素

3.了解层次、网状数据模型的特点


知识点:

1.E-R图:是现实世界到信息时间的第一层抽象、用于数据库设计


 1. 实体(Entity)
  一个实体是现实世界客观存在的一个事物。可以是一个具体的事物,如一所房子、一个元件、一个人等,也可以是抽象的事物,如一个想法、一个计划、或一个工程项目等等。实体由它们自己的属性值表示其特征。实体分为强实体和弱实体。

 2.实体集:
  结构和特性相同的实体组成的集合称为实体集。例如,学生实体集,班级实体集等。

    3.实体类型:
  描述实体集的信息结构,通常包括类型名和实体的属性名集合。例如,学生(学号,姓名,性别,年龄,班级)。
    4.属性:
  描述实体或联系的特性。实体的每个特性称为一个属性。属性有属性名、属性类型、属性定义域和属性值之分。
 5.实体标识(码或键):
  其值能唯一地标识每个实体的属性集称为实体的标识。在关系数据库中实体的标识称为码或键,其标识码是实体的单个属性或属性子集的值。
  例如,学生的学号,既是学生的属性又是学生的标识码,研究所的标识可以是研究所的所名或所的编号。
 6.联系:
  现实世界中,事物之间的相互联系是客观存在的,联系反映实体间的相互关系。这种联系必然要在信息世界中进行描述。而且,联系除用作属性外,联系本身也可以有属性值。
  例如,每个教师隶属一个研究所,每个教师和其隶属的一个研究所之间有一个隶属联系。 
 7.联系集:
  实体间相同类型的联系也构成联系集合。例如,多个教师和他们隶属的研究所之间就形成隶属联系集。
 8.联系类型:
  描述具有共同特性的实体之间联系集的信息结构,通常包括联系的类型名、联系的属性等。
  例如,每个教师和其隶属的一个研究所之间是"属于"联系;每个教师和其所教授的学生之间是"教与学"的联系;零件供应商和其供应的零件之间有"供应"联系,"供应"联系的属性有供应数量等。

 
 

2.数据模型的三要素

数据库结构的基础是数据模型,是对现实世界特征的数字化的模拟和抽象,数据结构、数据操作和数据约束条件组成,分为:

概念数据模型:E-R模型(实体、内部/之间联系、属性)、扩充的E-R模型(弱实体:依赖某个实体),是现实世界到信息时间的第一层抽象、用于数据库设计

基本数据模型:对现实世界数据特征的抽象,包括层次、网状、关系(由关系模式构成,关系模式相当于一个记录型,类似于程序设计中的类型定义)、面向对象等

· 数据模式(Data Model):
在数据库中,对数据(实体)的描述称为数据库模式。用相应的模式定义语言来描述。


3.层次/网状(DBTG)模型的特点





第3章 关系数据库

2.理解关系的6个性质

3.掌握概念:码、主属性与非主属性、全码及外码,关系模式的表示方法。

4.掌握关系的三类完整性约束条件(实体完整性、参照完整性及用户定义的完整性)

5.熟练使用关系代数表达各类查询(集合运算、选择、投影、连接、除) ;能够根据数据表结构,使用关系代数表达查询要求。

知识点:

1.关系的六个特点:

(1)同一属性的数据具有同质性。

(2)同一关系的属性名具有不能重复性。

(3)关系中的列位置可以交换。

(4)同一关系中的元组不能完全相同。

(5)元组顺序可以交换。

(6)每一个分量都必须是不可分的数据项。


2.概念

关系的码:

候选码:唯一标识关系中元组的一个属性或属性集。

比如:“学生关系”中学号能唯一标识每一个学生。若有多个候选码,则可以选一个做为主码,

主属性:包含在候选码中的任一属性称为主属性。

非主属性:不包含在任何候选码中的属性,比如:学生关系中的“学号”,教室关系中的“教室号”。

数据概念模型:

E-R图:

例下:

                               


关系模式的形式化表示:

R(U,D,DOM,F);

R:关系名。

U:组成该关系的属性所来自的域。

DOM:属性向域的映像集合。

F:属性间的数据依赖关系集合。


3.约束条件

实体完整性规则:

属性A是是基本关系R的主属性,则属性A的值不能为空值。

参照完整性;(F的每个属性为空值,或等于某个元组的主码值)。例下:


用户定义的完整性。


4.关系代数

关系数据语言:关系代数、关系演算、具有双重特点的语言(如SQL)

五种基本操作(并、差、选择、投影、笛卡儿积)

四种组合操作(交、连接、自然连接、除法)

扩充的关系代数操作:外连接、外部并、半连接

关系的类型:基本关系(实际存在的表),查询表(查询结果对于的表)视图表(不独立存储,数据库只存放定义,又称为虚表)

关系代数的运算符:





第4章 规范化理论

1.掌握概念:函数依赖、部分函数依赖、完全函数依赖及传递函数依赖。

4.掌握范式概念:1NF、2NF、3NF

5.掌握模式的分解方法及步骤;能够根据给定的关系模式,判断其范式类型,并根据要求进行分解,达到规定的范式级别。

 6.理解关系模式分解的原则


知识点:


关系数据库中的规范化理论主要包含三个方面的内容:

1,函数依赖,2,范式,3,模式设计。

函数依赖:同属于R(U)XYU的子集,Y值由X值决定,这种依赖称为函数依赖。在数据依赖中,函数依赖是最基本最重要的依赖。


在数据的规范化理论中,模式分解应满足的几个条件是:遵守规范化理论,保持原有的依赖关系,无损连接性。

1NF:消除非主属性对键的部分函数依赖关系,变为2NF.

2NF:  消除非主属性对键的传递函数依赖关系,变为3NF.

3NF:消除主属性对键的部分函数,和传递函数依赖关系,变为BCNF.

在规范化的过程中,逐渐消除了存储异常,使数据冗余度尽量小便于插入,删除,更新


关系模式的基本要求:

(1)元组的每一个分量必须是不可分的数据项。

(2)数据库中的数据冗余尽可能少。

(3)当对数据进行更新操作时,不会产生更新异常。

(4)进行插入操作,不会产生插入异常。

(5)进行删除操作,不会产生删除异常。



第5章 数据库设计

1.理解数据库设计的6个步骤及采用的方法

3.掌握概念结构(E-R图)设计方法,理解各分E-R图之间常见的三类冲突

4.掌握E-R图向关系模式转换的规则,了解数据模型的优化

能够根据给定的语义,找出相关实体、实体的属性、实体间联系,画出E-R图,并能转换为相应的关系模式。


知识点:

数据库设计的任务,内容,特点:

(1)广义的数据库设计,是指建立数据库及其应用系统,包括选择合适的计算机平台和数据库管理系统、设计数据库、以及开发数据库应用系统等.

(2)狭义的数据库设计,是指根据一个组织的信息需求、处理需求和相应的数据库支撑环境(主要是数据库管理系统DBMS),设计出数据库,包括概念结构、逻辑结构和物理结构。其成果主要是数据库。

(3)数据库设计有两种不同的方法:一种是以信息需求为主,兼顾处理需求,称为面向数据的设计方法;一种是处理需求为主,兼顾信息需求,称为面向过程的设计方法。

优缺点:第一种:可以比较好的反映数据的内存数据,既可以满足当前应用需求,也可以满足潜在需求。

                第二种:初始阶段可能比较满足,但随着应用的发展和变化,需要进行很大的改动,设计,以满足实际需求。

                在实际应用中,对于用户的数据是变动的,所以一般采用面向数据的设计方法。


数据库设计的成果:(1)数据库模式;(2)数据库为基础的典型应用程序,最基本的成果是数据库模式。

数据库设计的特点:

同其他工程一样,数据库也有自己的特点,主要表现在以下四个方面:

(1)复杂性。(2)反复性,(3)试探性,(4)分布进行。


数据库设计方法:

数据库方法学的指导原则:

1:可以在短时间内,合理的工作量,产生有实用价值的数据库结构。

2:具有足够的灵活性和通用性,可以供具有不同经验的人使用,使用与于不同数据模型的DBMS限制。

规范化的设计方法新奥尔良法,它将常见的数据库设计分为四个阶段:需求分析,概念分析,逻辑分析,物理分析。

基于E-R模型的数据库设计方法,基于3NF的设计方法。


数据库设计的步骤:

1:需求分析:

需求分析阶段,主要是准确收集用户信息需求和处理需求,并对收集的结果进行整理和分析,形成需求说明。需求分析是整个设计活动的基础,也是最困难和最耗时的一步。如果需求分析不准确或不充分,可能导致整个数据库设计的返工。

2:概念设计:

概念结构设计是数据库设计的重点,对用户需求进行综合、归纳、抽象,形成一个概念模型(一般为ER模型),形成的概念模型是与具体的DBMS无关的模型,是对现实世界的可视化描述,属于信息世界,是逻辑结构设计的基础。

3:逻辑结构设计阶段:

逻辑结构设计是将概念结构设计的概念模型转化为某个特定的DBMS所支持的数据模型,建立数据库逻辑模式,并对其进行优化,同时为各种用户和应用设计外模式。

4:物理设计:

物理结构设计是为设计好的逻辑模型选择物理结构,包括存储结构和存取方法,建立数据库物理模式(内模式)。

5: 实施和维护阶段:

实施阶段就是使用DLL语言建立数据库模式,将实际数据载入数据库,建立真正的数据库;在数据库上建立应用系统,并经过测试、试运行后正式投入使用。维护阶段是对运行中的数据库进行评价、调整和修改。





需求分析工具:

1:数据流图和数据字典。

2:UML统一建模语言:用例,静态,行为,实现图。


概念设计方法,步骤:

(1)自顶向下。

(2)自底向上。

(3)逐步扩张。

(4)混合策略。

E-R图设计方法:

是一种广泛采用的概念模型设计方法。表示方法如下:

1,实体。

2,属性。

3,联系。

UML设计方法:

UML类图与E-R图的区别:


逻辑结构步骤:

1.将概念模型结构转化为一般的关系,网状,层次模型。

2.将转化来的关系,网状,层次模型向特定的DBMS支持下的数据模型转化。

3.对数据模型继续优化。


E-R图作图步骤:

⑴确定所有的实体集合
⑵选择实体集应包含的属性
⑶确定实体集之间的联系
⑷确定实体集的 关键字,用下划线在属性上表明关键字的属性组合
⑸确定联系的类型,在用线将表示联系的菱形框联系到实体集时,在线旁注明是1或n(多)来表示联系的类型

数据冲突:

属性冲突、命名冲突、结构冲突

1.属性冲突 

(1) 属性域冲突,即属性值的类型、取值范围或取值集合不同。

例如:属性“零件号”有的定义为字符型,有的为数值型。

(2) 属性取值单位冲突。

例如:属性“重量”有的以克为单位,有的以公斤为单位。


2.命名冲突 

(1) 同名异义。不同意义对象相同名称。

(2) 异名同义(一义多名)。同意义对象不相同名称。“项目”和“课题”


3.结构冲突

(1) 同一对象在不同应用中具有不同的抽象。例如"课程 "在某一局部应用中被当作实体,而在另一局部应用中则被当作属性。

(2) 同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同。

(3) 实体之间的联系在不同局部视图中呈现不同的类型。

例如实体E1与E2在局部应用A中是多对多联系,而在局部应用B中是一对多联系;又如在局部应用X中E1与E2发生联系,而在局部应用Y中E1、E2、E3三者之间有联系。

解决方法是根据应用的语义对实体联系的类型进行综合或调整。


E-R图转换为关系模式:

 一个实体型转换为一个关系模式.实体的属性就是关系的属性,实体的码就是关系的码. 

对于实体间的联系则有以下不同的情况:

(1)一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并.

如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码.

如果与某一端实体对应的关系模式合并,则需要在该关系模式的属性中加入另一个关系模式的码和联系本身的属性.

(2)一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并.

如果转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,

而关系的码为n端实体的码.

(3)一个m:n联系转换为一个关系模式.与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,

各实体码的组合组成该关系的码,或码的一部分.

(4)三个或三个以上实体间的一个多元联系可以转换为一个关系模式.与该多元联系相连的各实体的码以及联系本身的属性均

转换为关系的属性,而关系的码为各实体码的组合.

(5)具有相同码的关系模式可合并.

第6章 SQL语言

1.数据定义语言、数据查询语言、数据更新语言

2. 索引、视图的概念

索引:属于物理存储的路径概念

视图:是一种虚拟的表,是从若干基本表和其他视图构造出来的表。用来查询多个表

存储过程:通过创建存储过程,可以执行多条SQL语句

触发器:是一种特殊的存储过程,并发性


能够根据给出的表结构和查询要求,写出相应的SQL 语句


 第7章 数据库安全保护(非重点章节)

1.掌握概念:事务、事务的特征

2.理解安全性控制的概念及常用的方法,掌握权限授予与回收的基本语句,

3.理解完整性控制的概念

4.理解并发控制的概念、并发所导致的三类数据的不一致性,理解封锁的概念,了解封锁协议

 5.了解数据库恢复的概念及原理

  • 2
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值