【数据库原理】-【数据库系统概述】

前言

思维导图


在这里插入图片描述


一、基础来源

什么是数据和信息?

信息:信息是人脑对现实世界事物的存在、运动状态以及事物之间的联系的抽象反映。
信息的特征

  • 源于物质和能量
  • 可感知的
  • 可储存、加工、传递和再生

数据:数据是用来记录信息的可识别的符号组合而成的,是信息的具体表现形式
数据的表现形式:包括数字、文字、图形、图像、声音和视频等。

数据和信息之间的关系?

数据是信息的符号表示,信息是对数据的语义解释。
因此,他们具有了信息传递的功能。可表示为以下关系:

信息 = 数据 + 语义

数据表示了信息,而信息只有通过数据形式表示出来才能被人们理解和接受。

数据处理和数据管理的关系?

数据处理:数据处理是将数据转换为信息的过程,包括对数据的收集、管理、加工利用乃至信息输出等一系列活动。
数据管理:数据管理较数据处理过程更为复杂,主要包括数据的分类、组织、编码、储存、维护、检索等操作。
数据处理过程中,数据是原料,是输出;而信息是产出,是输出结果。
“数据处理”的真正含义应该是为了产生信息而处理数据。

二、数据库技术的三个发展阶段

三个阶段的区别与特点

| |人工管理|文件管理 |数据库系统 |
|-|-|-|–|–|–|
|应用背景|科学计算|科学计算、管理|大规模管理
|硬件背景|无直接存储设备|磁盘、磁鼓|大容量磁盘
|软件背景|没有操作系统|有文件系统|有数据库管理系统
|处理方式|批处理|联机实时处理、批处理|联机实时处理、批处理、分布处理
|数据与程序之间对应关系|一一对应|一对多|一对N
|数据管理者|人|文件系统|数据库管理系统|
|数据面向对象|某个应用程序|某个应用程序|现实世界
|数据共享程度|无共享、冗余度大|共享性差、冗余度大|共享性大、冗余度小
|数据独立性|不独立完全依赖于程序|独立性差|具有高度的物理独立性1和一定的逻辑独立性2
数据结构化|无结构|记录内有结构、整体无结构|整体结构化,用数据模型描述
|数据控制能力|应用程序自己控制|应用程序自己控制|有DBMS提供数据安全性、完整性、并发控制和恢复

三、数据库系统

数据库系统的组成?

数据库系统(DataBase System,DBS)是指在计算机系统中引入数据库后的系统。
主要包括:数据库、数据库用户、计算机硬件系统、计算机软件系统等。

数据库系统的组成
数据库:(DataBase,DB)是指储存在计算机内、有组织的、可共享的的数据和数据对象(如表、视图、储存过程、触发器等)的集合。
数据库用户:按权限不同可分为三类:

  • 第一类:最终用户(End User)非计算机专业人员。
  • 第二类:应用程序员(Application Programmer)设计和编辑应用程序,并进行调试和安装。
  • 第三类:数据库管理员(Database Administrator,DBA)负责设计、建立、 管理和维护数据库以及协调用户对数据库要求的个人或工作团队 。

计算机硬件系统:硬件是指储存和运行数据库系统的硬件设备,包括CPU、内存、大容量存储设备、输入/输出设备和外部设备等。
计算机软件系统:DBMS、OS、应用开发系统、开发工具

数据库管理系统的地位和作用?

数据库在计算机系统中的地位示意图
由图可看出:DBMS在操作系统的支持下工作,应用程序在DBMS支持下才能使用数据库。 ·

四、数据库系统的内部体系结构

数据库的三级模式和二级映像是什么?

三级模式

  • 外模式:数据库用户能看到并允许使用的那部分局部数据的逻辑结构和特征的描述
  • 模式:数据库中全体数据的逻辑结构和特征的描述
  • 内模式:它是对数据库存储结构的描述,是数据在数据库内部的表示方式
  • 注意:内模式和模式只有个,外模式可有个。

二级映像

  • 外模式/模式映像:确定了数据的局部逻辑结构与全局逻辑结构之间的对应关系
  • 模式/内模式映像:确定了数据的全局逻辑结构与储存结构之间的对应关系

数据库的三级模式和二级映像

数据库系统中三级模式和二级映像的优点?

三级模式二级映像的优点

  • 保证数据独立性
  • 简化用户接口
  • 有利于数据共享
  • 有利于数据的安全保密

五、数据库系统的外部体系结构

从用户角度分为几种主要的体系结构?

  • 单用户结构的数据库系统
  • 主从式结构的数据库系统
  • 分布式结构的数据库系统
  • 客户机/服务器结构的数据库系统
  • 浏览器/服务器结构的数据库系统

分布式体系结构在物理和逻辑上的特点?

  • 数据在物理上是分布的
  • 数据在逻辑上是一个整体
  • 结点上分布存储的数据相对独立

B/S结构和C/S结构的差别和比较?

B/S结构和C/S结构的差别和比较图
由图可知
C/S:

  • 优点:
    网络运行效率大大提高这是因为服务器只将处理的结果返回客户机,从而大大提高减低了网络上的数据传输量。
    应用程序的运行和计算处理工作由客户机完成,减少了通信开销**,降低了服务器的处理工作、从而减轻服务器的负载
  • 缺点: 维护升级很不方便,需要在每个客户机上安装客户机程序,当应用程序升级时,就必须在安装所有应用程序的客户机上升级此应用程序。
    B/S
  • 优点有效的克服了C/S结构的不足

六、数据模型

如何通过多级抽象将现实世界中的业务数据转换为计算机世界存储的数据?

  • 现实世界中的业务数据经历三个世界二级抽象转换为计算机世界储存的数据
    在这里插入图片描述
    由图1 - 13 可知:首先要将现实世界的的事物及联系通过认识抽象成信息世界的概念模型,然后再抽象成为计算机世界的数据模型

概念模式、逻辑模型和物理模型之间的差异?

  • 概念模型 :(信息模型)是按用户的观点对数据和信息的建模,是对现实世界事物及联系的第一级抽象;概念模型是属于信息世界的模型
  • 逻辑模型:(数据模型和物理模型)按计算机的观点对数据建模,是对现实世界的二级抽象,主要用于DBMS的实现;逻辑模型是属于计算机世界的模型
  • 物理模型:是对数据的最底层抽象,描述数据在磁盘或磁带上的存储方法和存取方式

三个世界中相关概念是如何相互转换的?

  • 现实世界:既客观存在的世界

  • 信息世界:是现实世界在人们头脑中的反应,经过人脑的分析、归纳和抽象,形成信息,人们对这些信息进行记录、整理、归纳和格式化后,就构成了信息世界

  • 信息世界相关概念

关键字定义举例
实体(Entity)客观存在并且可以相互区别的事物学生
属性(Attribute)实体具有某一特性称为属性学号、姓名、年龄
实体性(Entity Type)具有相同属性的实体学生型
实体集(Entity Set)同型实体的集合所有学生
码(key)能唯一标识一个实体的属性或属性集学号
域(Domain)某一属性的取值范围性别域为男或女(类似于:enum)
联系Relationship单个实体型内部的联系和实体型之间的联系单个实体型内部:学生和姓名 ;实体型之间:学生课程
  • 两个实体型之间的联系
    (1)一对一(1:1)
    (2)一对多(1:n)
    (3)多对多(m:n)

  • 两个以上实体型之间的联系 :(1:1)、(1:n)、(m:n)

  • 单个实体实体型之间的联系 :(1:1)、(1:n)、(m:n)

  • 计算机世界:计算机世界是信息世界中的信息的数据化,就是将信息用数字符号等数据表示,便于存储在计算机中并由计算机进行识别和处理

  • 计算机世界的主要概念

关键字定义举例
字段(Field)标记实体属性的命名单位(数据项)姓名
记录(Record)字段的有序集合一个学生的记录
文件(File)同一类记录的集合所有学生记录
关键字(key)能唯一标识文件中每个记录的字段或字段集学号

三个世界中个术语的对应关系

四种数据模型有哪些各自有什么特点?

| |数据结构|数据操作|优点|缺点
—|—|—|—|----|—|----
层次模型|树|(1)插入数据:没有双亲结点值不能插入子女结点值;(2)删除操作:删除双亲结点时子女结点也将被删除;(3)修改操作:应修改所有相应的记录,以保证数据完整性|结构简单层次分明,便实现;查询效率很高;数据完整性好|无法直接表示多对多联系;插入删除操作限制太多;查询子女结点必须通过双亲结点
网状模型|有向图|(1)插入数据:插入数据时允许双亲结点的值尚未确定;(2)删除数据:允许只删除双亲结点;(3)修改数据:只需修改指定数据就好|直接表示客观世界,可表示多种复杂的联系;良好的性能和储存效率;|数据结构复杂;其DDL、DML及其复杂不便于用户掌握;访问数据时要指定存储路径,用户需要了解网状模型的细节,增加编程负担
关系模型|二维表|关系的模型:满足关系的完整性约束性条件:非关系模型:操作单个记录|有严格的数学理论依据;数据结构简单、清晰、用户易懂、易用,对数据的操作结果也是关系;存储路径对用户透明,拒具有更高的数据独立性、更好的安全保密性,简化程序员的工作|查询效率不如非关系模型,需要用户进行优化

  • 层次模型
    层次模型有树示意图

  • 网状模型

  • 关系模型

  • 面向对象模型:面向对象模型可以完整的描述现实世界的数据结构,就有丰富的表达能力,但模型复杂,涉及的知识较多,因此,面向对象数库尚未达到关系数据库的普及程度。

七 、 数据库领域的新技术

分布式数据库的特点?

  • 自制与共享
  • 冗余的控制
  • 分布式事物执行的复杂性
  • 数据的独立性
    (1)逻辑数据透明性
    (2)物理透明性
    (3)数据分布透明性
    (4)数据冗余透明性

数据挖掘主要应对的场景?

数据挖掘:从大量的数据中提取有效信息的过程

大数据的4V特征有哪些?

(1)数据量大(volume)
(2)数据类型繁多(variety)
(3)数据处理速度快(velocity)
(4)数据价值密度高(value)

总结

  • 信息、数据、数据处理与数据管理的基本概念;
  • 数据管理技术发展的三个阶段及各自的优缺点;
  • 数据库系统主要包括数据库、数据库用户、计算机硬件系统和计算机软件系统等几部分;
  • 数据库系统内部的体系结构:三级模式结构;
  • 数据库系统的三级抽象和二级映象保证了数据库系统的逻辑独立性和物理独立性;
  • 层次模型、网状模型、关系模型和面向对象模型
  • 数据库领域新技术

  1. 物理独立性:是指数据库的物理结构(如:存储结构、存储方式、外部存储设备等)改变时,通过修改映射,使数据库逻辑结构不受影响,进而用户逻辑结构及应用程序不用改变。 ↩︎

  2. 逻辑独立性:是指数据库逻辑结构(如:修改数据定义、增加新的数据类型、改变数据间的关系等)发生改变时,通过修改映射用户逻辑结构以及应用程序不用改变。 ↩︎

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jie3606

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值