数据库知识点概述-复习专用

数据库概述

数据库技术是基于数据库的数据管理技术。


特点
数据组织的结构化。从总体上看,文件系统中的数据是“涣散”的,而数据库中的数据是结构化的,具有统一的逻辑结构。数据的结构化是数据库的主要特征之一,是数据库和文件系统的最大和根本的区别。
减少数据冗余度,增强数据共享性。从整个系统上看,数据不再面向某一个特定的应用程序,而是面向由所有应用程序组成的系统。所以一个数据可以为多个应用程序所共享,一个应用程序也可以同时访问多个数据。
保证数据的一致性。通过建立文件间的关联,使得在对某一个数据进行更新时,与之相关的数据也得到相应更改。

具有较高的数据独立性。在数据库系统中,数据独立性包含两个方面,一个是数据的物理独立性,另一个是数据的逻辑独立性。
数据的物理独立性是指在数据的物理存储结构发生改变时,数据的逻辑结构可以不变的特性;
数据的逻辑独立性是指在总体逻辑结构改变时,应用程序可以不变的一种特性。

    数据库之所以具有较好的数据独立性,主要是因为数据库提供了两个映象功能:数据的存储结构和逻辑结构之间的映象或转换功能以及数据的总体逻辑结构和局部逻辑结构之间的映象功能。前者保证了数据的物理独立性,后者则保证了数据的逻辑独立性
 

以数据项为单位进行数据存取。相对文件系统而言,数据库可以实现更小粒度的数据处理,满足更多的应用需求。
具有统一的数据控制功能。这些功能包括数据的安全性控制、完整性控制、并发控制和一致性控制等功能


大数据

大数据的“4V”特性:
(1)体量大(Volume)。大数据体现在数据量极为庞大,其计量单位可以是TB级、PB级甚至更大的计量单位。
(2)速度快(Velocity)。大数据呈现出高速增长的态势,而且产生速度仍在不断加快。
(3)多样化(Variety)。大数据包含多种多样的数据类型,既可以是存储在二维表中的结构化数据,也可以是文本、视频、图像、语音、图(Graph)、文件等非结构化数据。
(4)价值高(Value)。大数据中蕴藏着巨大价值,但价值密度低。通过对大数据进行合理的分析,能够从中挖掘出很多有价值的信息,这些信息将有助于提高社会生产效率,提升人们生活质量,或者创造更大商业价值。


数据库系统

      

数据库

定义:是数据库系统存放结构化数据的地方,是长期存储的、有组织的、可共享的数据的集合
数据最终是以文件的形式存储在磁盘上,只有数据库管理系统才能对这些文件进行存取操作。
每一个数据库都至少有一个这样文件,称为数据文件。

数据库管理系统

定义: DBMS是数据库的管理软件,是应用程序和数据库之间桥梁,即应用程序必须通过DBMS才能存取数据库中的数据。
DBMS对数据的存取操作最终体现为对数据文件的更新和修改,但应用程序不能直接执行这种更新和修改操作。
SQL Server 2008就是SQL Server数据库系统的一种DBMS。
 

应用程序

定义: 是指通过访问数据库来完成用户操作的程序。
它介于系统用户和DBMS之间,用户通过操作应用程序来获取他们的需求,而应用程序则通过DBMS访问数据库来实现用户提出的需求。
应用程序可以用Java、JSP、.NET等技术开发

系统用户

定义:是大致分为两类——系统用户和系统管理员。
系统用户是指应用程序的用户,他们是整个数据库系统的最终使用者;
系统管理员可以分为不同级别类型的管理人员,他们主要负责数据库的管理和维护工作。
 

数据库系统各部分之间的关系

数据库系统的模式结构


现在数据库系统软件产品非常多,它们可能基于不同的操作系统,支持不同的数据库语言,采用不同的数据结构,等等。但是,它们的体系结构却基本相同,那就是三级模式结构。

三级模式结构是由美国国家标准学会( American National Standards Institute, ANSI )所属的标准计划和要求委员会(Standards Planning And Requirements Committee ,SPARC )于1975年提出的,称为SPARC分级结构
 

三级模式结构将数据库系统抽象为三个层次,分别为内模式、概念模式和外模式

三级模式结构将数据库系统抽象为三个层次,分别为内模式、概念模式和外模式。


1.内模式


 定义:又称存储模式,它是数据在数据库系统中最底层的表示,描述了数据的物理结构和存储方式,即定义了存储记录的类型、存贮域的表示、存储记录的物理顺序、索引等。

一个数据库仅有一个内模式
 

2.概念模式


 定义:又称逻辑模式,简称模式,它用于对整个数据库中数据的逻辑结构和特征、实体及其性质与联系进行描述。但这种描述并不涉及具体的物理存储方式和硬件环境,也不涉及任何特定的应用程序及其开发工具。

一个数据库也只有一个概念模式
 

3. 外模式


 定义:外模式是概念模式的一个子集,这个子集是为某一个特定用户所使用的。从这个角度看,外模式是面向用户的,所以外模式又称子模式或用户模式

本质上,外模式是应用程序所使用的局部数据的逻辑结构和特征的描述,是使用该应用程序的用户所看到的数据视图。即用户视图。
 

总结


以上三个模式分别从三个不同层次的级别对数据库进行抽象,即分别抽象为用户级、概念级、物理级数据库


用户级数据库对应于外模式,是从用户的角度对数据库进行抽象,是用户看到和使用的用户视图的集合。
物理级数据库对应于内模式,是从数据的物理存储结构的角度对数据库进行抽象。
概念级数据库对应于概念模式,介于用户级和物理级之间,是程序开发人员看到和使用的数据库。
总之,外模式是概念模式的子集,概念模式是内模式的逻辑表示,而内模式则是概念模式的物理表示。
 

DBMS在外模式和概念模式之间提供外模式/概念模式映像功能,在概念模式和内模式之间提供概念模式/内模式映像功能。前者保证了数据的逻辑独立性,后者则保证了数据的物理独立性。
 


数据模型

数据模型三种类型 


概念模型又称信息模型,是从用户观方面来对数据和信息进行建模的结果,是对现实世界的食物及其联系的第一季抽象,它不依赖于具体的计算机系统,不是DBMS支持的模型,主要用于描述用户所关心的信息结构,属于信息世界中的模型,用于数据库的设计。
逻辑模型是对客观事物及其联系的数据描述,包括网状模型、层次模型、关系模型和面向对象模型等,它是从计算机系统观方面来进行建模,主要用于DBMS的实现,属于计算机世界的模型。
物理模型是对数据最底层的抽象,用于描述数据在计算机系统内部的表示方式和存取方法,其实现由DBMS完成。

数据模型的两大主要功能是用于描述数据及其关联。

它包含三个基本要素,即数据结构、数据操作和数据的约束条件。
 

数据模型的基本要素


1.数据结构


定义:用于描述数据的静态特性,它是所研究对象类型的集合。
分类:

数据描述对象
定义:用于描述数据的性质、内容和类型等相关的对象
指出对象所包含的项,并对项进行命名,指出项的数据类型和取值范围等。

数据关系描述对象
定义:是用于描述数据间关系信息的对象
指明各种不同对象类型之间的关系及关系的性质,并对这些关系进行命名。
 

2.数据操作

定义:用于对数据动态特性的描述,它是对数据库中各种对象类型的实例允许执行的所有操作及相关操作规则的集合。
分类:
        查询
        更新                更新操作又包括插入、删除和修改。
在数据模型中,要明确定义操作的各项属性,如操作符、操作规则以及实现操作的语言等。

3.数据的约束条件


数据的约束条件是一组完整性规则的集合。完整性规则是指既定的数据模型中数据及其关系所具有的制约性规则和依存性规则。这些规则是通过限定符合数据模型的数据库状态及其变化的方法来保证数据的正确性、有效性和相容性。

三个要素的作用
数据结构是基础,它确定着数据模型的性质
数据操作是关键,它确定着数据模型的动态特性。
约束条件主要起辅助作用。
 

四种主要的逻辑模型

1.层次模型


它的数据结构是根树
特点:
        有且仅有一个节点没有父节点,这个节点就是根树的根节点。
        除了根节点外,其他节点有且仅有一个父节点,但可能由0个或者多个子节点。

2.网状模型


网状模型的数据结构是网状结构。网状模型反映着现实世界中实体间更为复杂的联系。由以下特点可以看出,节点间没有明确的从属关系,一个节点可以与其它多个节点有联系。
特点
        允许存在一个以上的节点没有父节点。
        节点可以有多余一个的父节点。
缺点
        由于在使用网状模型时,用户必须熟悉数据的逻辑结构,所以结构的复杂性增加了用户查询和定位的难度。
        不支持对于层次结构的表达等。

3.关系模型


关系模型是当今最为流行的一种数据模型。在关系模型中,实体间的联系是通过二维关系(简称关系)来定义,其数据结构就是二维关系。每个一种二维关系都可以用一张二维表来表示,表达直观、明了。所以,很多时候是把二维表和关系直接等同起来,简称为(二维)关系表。关系模型就是若干张关系表的集合。
 

关系模型的术语
关系:一张二维表。
记录(或元组):关系表中的一行。
字段(或属性):关系表中的一列。
:即字段的值域,也就是字段的取值范围。
数据项(或分量):某一个记录中的一个字段值。
主关键字段(或主码):简称主键,是关系表中一个或者多个字段的集合,这些记录的值能够唯一标识每一个记录。
关系模式:是对关系的一种抽象的描述,其描述格式为“关系名(字段1,字段2,…,字段n)”,其中“字段1”带下划线,表示该字段是主关键字段。
 

关系模型的特点:


具有严密的数学基础。关系代数、关系演算等都可以用于对关系模型进行定性或者定量的分析,探讨关系的分开和合并及其有关性质等。
概念单一化、表达直观,但又具有较强的数据表达和建模能力。一般来说,一个关系只表达一个主题,如果有多个主题在一起,则需要将它们分开,用多个关系来表示,这就是概念的单一化。
关系都已经规范化。即关系要满足一定的规范条件,这使得关系模型表现出特有的一些性质。
        例如,在一个关系中数据项是最基本的数据单位,它不能再进行分解;同一个字段的字段值具有相同的数据类型;各字段的顺序是任意,记录的顺序也是任意的,等等。
在关系模型中,对数据的操作是集合操作,即操作的对象是记录的集合,操作所产生的结果也是记录的集合。这种操作不具有明显的方向性,不管如何操作,其难度都一样。而在层次模型和网状模型中,对数据的操作带有明显的方向性,在正反两个方向上操作的难度完全不一样。

概念模型


当将现实世界中的实际问题转化为信息世界中的概念模型时,用什么来描述这种概念模型呢?
 

当在数据库理论中,通常用E-R图来描述概念模型 ,它提供了表示实体型、属性和联系的方法。
 

 

E-R图 


1.实体及其属性的表示
【例子】 对于一个实体型——学生(学号,姓名,成绩),其E-R图如图1.10所示。

2. 实体型之间联系的表示
两个实体型之间联系的表示
 

 

 

3.多个实体型(3个或3个以上)之间联系的表示
三个实体型A、B、C之间联系表示为(m:n:o),其中m,n,o > 0

【例子】 对于供应商、仓库和零件,由于一个供应商可以提供多种零件并存放在不同仓库中,而一种零件也可以由多个供应商提供并存放在不同仓库中,同时一个仓库也可以存放不同供应商提供的多种零件。所以供应商、仓库和零件之间的联系是多对多联系,其E-R图可以用图1.12表示。
 

 

4. 多个实体型(3个或3个以上)之间联系的表示

 一个教师可以教授多门课程,可以教授多个学生;一个学生可以选择多门课程,可以上多个老师的课;一门课程可以被多个老师教,可以被多个学生选。

5. 实体型内部联系的表示
同一个实体型内部实体的三种联系对应的E-R图,分别如图所示。
 

 

职工实体型中的实体具有领导与被领导的联系,这种联系是一对多联系,用图表示。。

 

联系属性的表示
联系的属性的表示方法与实体的类似
对于供应商和仓库之间的联系(库存),其属性(库存量),可以表示如图1.15所示。

ER图到关系模式的转换
 

1.实体类型的转换

        (1)将每个实体类型转换成一个关系模式。

        (2)实体的属性即为关系模式的属性。(3)实体标识符即为关系模式的键。 

2.二元联系类型的转换

        (1)若实体间联系是1:1,可以在两个实体类型转换成的两个关系模式中任意一个关系模式的属性中加入另一个关系模式的主键和联系类型的属性。

        (2)若实体间联系是1:N,则在N端实体类型转换成的关系模式中加入1端实体类型的主键和联系类型的属性。

        (3)若实体间联系是M:N,则将联系类型也转换成关系模式,其属性为两端实体类型的主键加上联系类型的属性,而键为两端实体键的组合。 

3.一元联系类型的转换和二元联系类型的转换类似。

4.三元联系类型的转换

        (1)若实体间联系是1:1:1,可以在三个实体类型转换成的三个关系模式中任意一个关系模式的属性中加入另两个关系模式的主键(作为外键)和联系类型的属性。

        (2)若实体间联系是1:1:N,则在N端实体类型转换成的关系模式中加入两个1端实体类型的主键(作为外键)和联系类型的属性。

        (3)若实体间联系是1:M:N,则将联系类型也转换成关系模式,其属性为M端和N端实体类型的主键(作为外键)加上联系类型的属性,而键为M端和N端实体键的组合

        (4)若实体间联系是M:N:P,则将联系类型也转换成关系模式,其属性为三端实体类型的主键(作为外键)加上联系类型的属性,而键为三端实体键的组合。

 

总结


利用实体、属性和联系及其之间关系的表示方法可以将现实世界中的复杂问题抽象成为信息世界中的概念模型。
概念模型通常是用E-R图表示的,E-R图的设计过程就是对问题进行抽象和建模的过程。
 


某高校信息系统设计的分E-R图中,人力部门定义的职工实体具有属性:职工号、姓名、性别和出生日期;教学部门定义的教师实体具有属性:教师号、姓名和职称。这种情况 属于(          ),在合并E-R图时,(          )解决这一冲突。

A.属性冲突   B.命名冲突   C.结构冲突   D.实体冲突

A.职工和教师实体保持各自属性不变

B.职工实体中加入职称属性,删除教师实体

C.教师也是学校的职工,故直接将教师实体删除

D.将教师实体所有属性并入职工实体,删除教师实体

CB

解析:
属性冲突。同一属性可能会存在于不同的分E- R图,由于设计人员不同或是出发点不同,对属性的类型、取值范围和数据单位等可能会不一致

命名冲突。相同意义的属性在不同的分E- R图中有着不同的命名,或是名词相同的属性在不同的分E-R图中代表这不同的意义。

结构冲突。同-实体在不同的分E-R图中有不同的属性,同-对象在某一分E-R图中被抽象为实体 ,而在另一分E-R图中又被抽象为属性,

需要统一。本题属于结构冲突没有实体冲突的说法。将局部的E-R图集成为全局E-R图时,可能存在3类冲突。

属性冲突:包括类型、取值范围、取值单位的冲突;

结构冲突:例如同一对象在一个局部E-R图中作为实体,而在另一个局部E-R图中作为属性,同一实体在不同的E-R图中的属性个数和类型不同等,

命名冲突:包括实体类型名、联系类型名之间异名同义,或同名异义等。
 


 

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ZuckD

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值