数据库:基本概述,数据模型,体系结构,系统组成

1,基本概念

1.1,数据库的四个基本概念

数据(Data):描述事物的符号记录,是数据库中存储的基本对象。数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵。

数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。如:数据:93。语义1:学生某门课的成绩,语义2:某人的体重。

数据库(DB):长期存储在计算机内,有组织,可共享的大量数据的集合。如:学校教务系统数据库。

  • 数据库通常分为:层次数据库,网络式数据库,关系式数据库。
  • 数据库基本特点:永久存储,有组织和可共享。

数据库管理系统(DBMS):种操纵和管理数据库的大型软件,用于建立、使用和维护数据库,对数据库进行统一的管理和控制,以保证数据库的安全性和完整性如:Mysql,Oracle。

  • 数据库管理系统是数据库系统的核心
  • 位于用户与操作系统之间的一层数据管理软件
  • 大部分DBMS提供数据定义语言DDL数据操作语言DML供用户定义数据库的模式结构与权限约束,实现对数据的追加、删除等操作

数据库系统(DBS):数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。

数据库系统一般由数据库(DB)、数据库管理系统(DBMS)、应用系统、数据库管理员和用户构成。DBMS是数据库系统的基础和核心

★★★在不引起混淆的情况下常常把数据库系统简称为数据库

数据库系统的特点:

  • 数据的整体结构化:数据用数据模型描述,无需应用程序定义。不再针对某一应用,数据之间具有联系,数据记录可变长。
  • 数据的共享性高,冗余度低且易扩充:数据面向整个系统,可以被多个用户、多个应用共享使用。
  • 数据独立性高:物理存储逻辑结构都相互独立。数据独立性由数据库管理系统的二级映像功能来保证。
  • 数据由数据库管理系统统一管理和控制:数据的安全性(security)保护、数据的完整性(integrity)检查、并发(concurrency)控制、数据库恢复(recovery)。

1.2,数据库管理技术的产生和发展

数据管理指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题

人工管理阶段(20世纪50年代中之前):计算机主要用于科学计算,无直接存取存储设备,没有操作系统,没有数据管理软件。

特点:数据保存;数据面向应用;没有共享、数据冗余大;数据与程序之间的依赖性大,不独立;应用程序自己控制数据;没有专门的数据管理软件,基本上没有文件的概念。

文件系统阶段(20世纪50年代末——60年代中):计算机大量用于科学计算与数据处理,有了专门管理数据的软件,称为文件系统。

特点:具有文件系统,数据可长期保存;数据面向应用;共享性差、数据冗余度大;记录内有结构,整体无结构;文件系统提供数据与程序之间的存取方法,独立性差;应用程序自己控制数据;文件之间缺乏联系,相互孤立,仍然不能反映现实世界各种事物之间错综复杂的联系。

数据库系统阶段(20世纪60年代末——现在):计算机应用于社会各个领域,计算机管理的数据量大,关系复杂,共享性要求强。

特点:数据结构化;数据共享性好;数据独立性好;数据库管理系统DBMS)对数据进行统 一的管理和控制。;为用户提供了友好的接口。

1.3,数据库分类

数据库可以按照存储模型、关系型/非关系型来进行分类:

2,数据模型

数据是描述事物的符号记录,模型是现实世界的抽象

数据模型(Data Model)是数据特征的抽象,通俗地讲数据模型就是现实世界的模拟。

  • 数据模型所描述的内容包括三个部分:数据结构数据操作数据约束
  • 数据模型按不同的应用层次分成三种类型:分别是概念数据模型逻辑数据模型物理数据模型
  • 数据模型是数据库系统的核心和基础,数据库管理系统是数据库系统的核心。
  • 数据模型应该满足:能比较真实地模拟现实世界容易为人所理解便于在计算机上实现。

2.1,两类数据模型

第一类:概念模型:称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。

第二类:逻辑模型:主要包括:层次模型、网状模型、关系模型、面向对象模型和对象关系模型等。它是按计算机系统的观点对数据建模,主要用于DBMS的实现。

第二类:物理模型:是对数据最低层的抽象,它描述数据在系统内部的表示方式和存取方法,是面向计算机系统的。它的具体实现是DBMS的任务。

2.2,数据模型的组成要素

数据结构:描述数据库的组成对象,以及对象之间的联系。

描述的内容有两类:一类与对象的类型、内容、性质有关;一类与数据之间联系有关

数据结构是对系统静态特性的描述

数据操作:数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。

数据操作是对系统动态特性的描述

数据约束:用来对数据库中的数据进行约束,详见下一章。

2.3,概念模型

实体对应于现实世界的实体。如一个学生,一门课。
属性对应于实体的特征。一个实体可以由若干个属性来刻划。例如,学生实体可以有学号、姓名、性别等属性。
对应于实体的标识特征。例如,学生可以用学号来唯一标识。
属性的取值范围称为2该属性的域。例如,年龄的域为不小于零的整数。
实体型用实体名及其属性名集合来描述实体。例如,学生实体型描述为:学生(学号,姓名,性别,年龄)。
实体集同型实体的集合构成了实体集。例如,全体学生实体型构成了学生实体集

实体间的联系

  • 现实世界中的事物之间通常都是有联系的,这些联系在信息世界中反映为实体内部(属性)的联系和实体之间的联系
  • 实体内部的联系通常是指组成实体的各属性之间的联系实体之间的联系通常是指不同实体集之间的联系;

概念模型:概念模型是对真实世界中问题域内的事物的描述,也称信息模型,是按用户的观点来对数据和信息建模,用于数据库设计

概念模型有多种表示方法,其中最常用的是“实体-联系法”,简称E-R方法,该方法用E-R图来描述现实世界的概念模型。

ER图详解:数据库:实体关系图(ER图)_燕双嘤-CSDN博客_数据库实体图和er图https://shao12138.blog.csdn.net/article/details/103659528

2.4,逻辑模型

层次模型:指用树行结构表示实体及其之间的联系,树中每一个节点代表一个记录类型,树状结构表示实体型之间的联系。

层次数据模型中最基本的数据关系是基本层次关系,它代表两个记录型之间一对多的关系,也叫做双亲子女关系(PCR)。数据库中有且仅有一个记录型无双亲,称为根节点

满足下面两个条件的基本层次联系的集合为层次模型:且只有一个结点没有双亲结点,这个结点称为根结点以外的其它结点有且只有一个双亲结点

★层次模型的特点:结点的双亲是唯一的只能直接处理一对多的实体联系每个记录类型可以定义一个排序字段,也称为码字段任何记录值只有按其路径查看时,才能显出它的全部意义没有一个子女记录值能够脱离双亲记录值而独立存在

网状模型:用网络结构表示实体类型及其实体之间联系的模型。

网状模型中的每个结点表示一个记录类型(实体),每个纪录类型可包含若干个字段(实体的属性),记录(类型)之间的联系用结点之间的连线(有向边)表示,表示记录类型之间的一对多的父子联系。

网状模型的特点:允许一个以上的节点无双亲。个节点可以有多于一个的双亲。

关系模型:二维表(中间表)的形式表示实体和实体间联系的数据模型。

关系的定义和性质:关系中的每一个属性值都是不可分解的,不允许表中还有表 关系中不允许出现相同的元组。关系中不考虑元组之间的顺序。元组中属性也是无序的

数据模型优点缺点
层次模型

层次模型的数据结构比较简单清晰

查询效率高,性能优于关系模型,不低于网状模型

层次数据模型提供了良好的完整性支持

结点之间的多对多联系表示不自然

对插入和删除操作的限制多,应用程序的编写比较复杂

查询子女结点必须通过双亲结点

层次命令趋于程序化

网状模型

能够更为直接地描述现实世界,如一个结点可以有多个双亲

具有良好的性能,存取效率较高

结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握

DDLDML语言复杂,用户不容易使用

记录之间联系是通过存取路径实现的,用户必须了解系统结构的细节

关系模型

建立在严格的数学概念的基础上

概念单一

a.实体和各类联系都用关系来表示

b.对数据的检索结果也是关系

关系模型的存取路径对用户透明

a.具有更高的数据独立性,更好的安全保密性b.简化了程序员的工作和数据库开发建立的工作

存取路径对用户透明,查询效率往往不如格式化数据模型

为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度

3,数据库系统的体系结构

数据库系统内部的系统结构:数据库领域公认的标准结构是三级模式结构,它包括外模式概念模式内模式,有效地组织、管理数据,提高了数据库的逻辑独立性和物理独立性。

数据库系统外部的系统结构:数据库系统的结构分为单用户结构、主从式结构、分布式结构、客户机/服务器结构和浏览器/服务器结构。

3.1,数据库系统模式的概念

模式:数据库中全体数据的逻辑结构和特征的描述。它仅仅涉及到结构的描述,不涉及到数据库本身具体的值

模式的一个具体值称为模式的一个实例(Instance),同一个模式可以有很多实例

模式是相对稳定的,而实例是相对变动的,因为数据库中的数据在不断更新

模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态

3.2,数据库系统的三级模式结构

模式(概念模式,逻辑模式):是对数据库全局逻辑结构的描述,是数据库所有用户的公共数据视图

模式的描述:所有实体、实体的属性和实体间的联系。数据的约束。数据的语义信息。安全性和完整性信息

概念模式的地位:是数据库系统模式结构的中间层;与数据的物理存储细节和硬件环境无关;与具体的应用程序、开发工具及高级程序设计语言无关

一个数据库只有一个概念模式

外模式(子模式,用户模式):是用户观念下局部数据结构的逻辑描述,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述

一个数据库可以有多个外模式

内模式(存储模式):是对数据库中数据物理结构和存储方式的描述,是数据在数据库内部的表示形式

内部模式定义了所有内部记录类型、索引和文件的组织方式,以及所有数据控制方面的细节(包括数据是否压缩存储、数据是否加密)

内模式是DBMS管理的最低层。虽然称其为物理模式,但它不涉及物理记录的形式,如物理块或页、具体设备的柱面与磁道大小等,内部视图仍然不是物理层,是最接近物理存储的数据存储方式,是物理存储设备上存储数据时的物理抽象

一个数据库只有一个内模式

3.3,数据库系统的两级映像

外模式/模式映像

模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。对应于同一模式可以有任意多个外模式。对于每一个外模式,数据库系统都有一个外模式/模式映像,它定义了该外模式与模式之间的对应关系。这些映像定义通常包含在各自外模式的描述中。

模式/内模式映像

数据库只有一个模式,也只有一个内模式,所以模式/内模式映像是惟一的,它定义了数据全局逻辑结构与存储结构之间的对应关系。

4,数据库系统的组成

数据库系统对硬件资源的要求:

  • 足够大的内存
  • 足够的大的磁盘或磁盘阵列等设备
  • 较高的通道能力,提高数据传送率

数据库系统软件包括:

  • 数据库管理系统
  • 支持数据库管理系统运行的操作系统
  • 与数据库接口的高级语言及其编译系统
  • 以数据库管理系统为核心的应用开发工具
  • 为特定应用环境开发的数据库应用系统

人员主要包括:

  • 数据库管理员
  • 系统分析员和数据库设计人员
  • 应用程序员
  • 最终用户

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

燕双嘤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值