数据库概念
数据系统的相关概念
- 数据:是不同客观事物具体特征描述的符号记录,是信息的表达方式和载体,是利用信息技术进行采集、处理存储和传输的基本对象
- 数据概念的两方面意义:
- 数据的内容、含义(实质是信息)。
- 数据的表现形式,是符号(记录)。
- 数据概念的两方面意义:
- 信息:是客观事物的状态的状态和特征。机器之间的相互联系等要素再人脑中的反映,通过人脑抽象后新城的概念及描述。
- 数据与信息的区别:数据是信息的载体和具体表示形式。一种符号化表示方法。信息反映数据含义。信息来源于数据。以数据的形式存储、管理、传输和处理,数据经过处理后可得到更多有价值的信息。(信息是概念性的,数据是物理性的)
- 信息可用数据的不同形式来表示。数据的表示方式可以选择,而信息不随数据表现形式而改变。
- 数据处理:是对数据进行加工的过程,对数据进行的查询、分类、修改、变换、运算、统计、汇总等都属于加工。目的是根据需要,从大量的数据中抽取出有意义,有价值数据(信息),作为决策和行动的依据,其实质是信息处理。
- 数据管理:是对原有基本数据进行管理为目的,再数据处理的过程中,数据收存储、检索、分类、传输等基本环节统称为数据管理。
- 狭义上一般使数据发生较大根本性变化的数据加工成位数据处理(其他称为数据管理),如汇总,而广义上时常不加区别地统称为数据处理
数据库,数据库管理系统与数据库系统概念
-
数据库:是人们借助计算机和数据库技术对传统的存储在文件柜中的数据进行科学保存和管理并能方便利用的一种数据管理技术。
- 数据库使按照数据结构 组织、存取和处理 数据的集合。可理解为“按一定结构存管数据的库(空间)”,使在计算机内的、有组织(结构)的、可共享、长期存储的数据集合。数据库中的数据可按照一定的数据模型(结构)进行组织、描述金额存储,具有较高的数据独立性和易扩展性,较小的冗余度,并可共享。数据库还具有集成性、共享性、海量性和持久性等基本特征。数据库技术主要用于根据需求自动处理、管理和控制大量业务数据。
-
数据库管理系统(DBMS):是指建立、运用、管理和维护数据库,并对数据进行统一管理和控制的系统软件。用于用户定义和操作、管理、控制数据库和数据,并保证数据的安全性、完整性、多用户对数据并发操作及发生意外时的备份恢复等。
- DBMS是整个数据库系统的核心,对数据库中的各种数据进行统一管理、控制和共享。
-
数据库系统:是指在计算机系统中迎入数据库后的系统,一般由数据库、数据管理系统(及其开发工具)、应用系统、数据库管理员及用户构成
- 数据库的创建、使用和维护等工作不能只靠一个DBMS ,需要哦有专门的人员来管理和维护。负责此类人员称为数据库管理人员
- 为了不引起不必要的歧义,通常情况下匠数据库系统简称为数据库
数据模型的概念和类型
-
数据模型:是数据结构的特征的抽象描述(表示),是数据处理的关键和基础。用于现实世界中的数据特征的抽象、表示和处理,DBMS的实现都是建立在某种数据模型基础上的。
-
数据模型的组成要素:
- 数据结构:描述数据库的组成对象以及对象之间的联系。是所研究的对象类型的集合,是对系统的静态特征的说明。其描述内容包括两类,一是与数据类型、内容、性质有关的对象,如关系模型(表状结构)中的域、属性、关系等;二是与数据之间联系有关的对象。
- 数据操作:描述系统的同台特性,是对数据库中的各种对象(型)的实例(值)执行的操作的集合,包括操作及其有关规则。对数据库的操作主要有数据维护和数据检索两大类,这是任何数据模型都必须规定的操作,包括操作符、含义和规则等。
- 数据的约束条件:是一组完整性规则的集合。完整性规则是给定的数据模型中的数据及其联系所具有的制约和依存规则(条件和要求),用于限定符合数据模型的数据库状态及其变化,保证数据正确、相容和有效。
-
数据模型的类型:
- 概念模型:也称信息模型,是面向数据库用户的实现世界的模型。主要用于描述事物的概念化结构,使数据库的设计人员在设计的初期,避开计算机系统及DBMS的技术问题,以图形化方式分析表示事物(实体)数据特征(属性)及其之间的联系等,最常用的使实体联系模型(E-R图)。
- 逻辑模型:是逻辑数据模型的简称,**是以计算机系统的观点对数据建模,是直接面向数据库的逻辑结构,**是对客观现实世界的第二层抽象。是具体的DBMS所支持的数据模型,如网状模型、层次模型和关系模型等。
- 物理模型:是面向计算机物理表示的模型,描述数据在储存介质的组织结构,及与具体DBMS有关,也与操作系统和硬件有关。如存取路径、方式、索引等。
概念模型相关概念及表示
-
实体:实现时世界中可以相互区别的事物或活动。
-
实体集:是同一类实体的集合。
-
实体型:是对同类实体共同特征和性质的抽象刻画。
-
实体值:是符合实体型定义的、某个实体的具体描述(值)。
-
联系:是指现实世界中事物内部以及事物之间的联系,如学生与课程之间的选课关系、学生与图书之间的借阅关系和学生之间的班长关系。
-
联系集:是同类联系的集合。
-
联系型:是对同类联系共有特征的抽象定义。
-
联系值:是对同类兰溪型定义的、某个联系的具体描述。
-
属性:是描述实体或联系中的一种特征,一个实体或联系通常具有多个(项)特征,需要多个相应属性来描述。实体的属性由实际应用需要决定,并非一成不变。
-
键 或称 码、关键字、关键码等:是区别实体的唯一标识。
实体(关系表)中用于键的属性称为主属性,否则称为非主属性。
-
域:是一组具有相同数据类型的值的集合。实体中属性的取值范围往往来自某个域。
-
实体之间联系分类:
- 一对一联系
- 一对多联系
- 多对多联系
E-R模型的构成要素
- 矩形:表示实体,框内写上实体名称
- 菱形:表示联系,菱形框内写上联系名;
- 椭圆形:表示属性,椭圆形框内写上属性名;
- 连接线:表示实体、联系与属性之间的所属关系或实体与联系之间的相连关系。
逻辑模型
- 层次模型:用树形结构来表示现实世界中的实体和实体之间的联系。有且只有一个没有双亲的根节点,其余节点为其子孙节点;除根节点外,每个节点有且仅有一个父节点。
- 优点:
- 由于显示世界中的实体之间的联系自然呈现为层次关系(一对多),表示一对多是结构简单清晰;
- 层次结构查询效率高,主要原因是DBMS指针效率高
- 缺点:
- 表示多对多联系时比较笨拙;
- 查询子女节点时必须通过双亲节点有一定的效率影响。
- 优点:
- 网状模型:是对层次模型的扩展,允许一个以上的节点无双亲,同时也允许一个节点可以有多个双亲。层次模型为网状模型中的一种最简单情况。
- 优点:能直接地表示显示世界,如一个节点有多个双亲的情况;性能良好,有较高的存取效率
- 缺点:结构复杂,用户掌握困难;数据定义和数据操作需嵌入高级语言,用户掌握难度大。
- 关系模型:是一张规范化的二维表
- 其模型中的每个实体和实体之间的联系都可直接转换为对应的二维表形式。每个二维表称为一个关系,其中的关系的型由二维表的表头确定,除表头外表中的每一行为关系的值。二维表中的每一行称为一个元组,二维表的每列数据称为属性,给每一列起一个名称即属性名。
- 关系模型可渐变表示概念模型中的实体和类型的联系,对应某个关系,包括相联系的各实体的键。
- 优点:
- 由较坚实的数学理论基础。
- 数据结构简单,易用易懂。
- 数据存取路径对用户清晰,由较好的数据独立和数据安全性。
- 查询与处理方便。
- 数据独立性很高。
- 缺点:
- 查询效率较格式化数据模型低
- 关系数据管理系统实现较难。
数据库系统的组成
-
包括数据库、数据库管理系统、应用系统和用户(包括开发人员、管理人员、和使用人员)四个部分
-
可以从不同的角度来分类
-
用户多少:
单用户、多用户
-
用途和使用范围
数据仓库或决策支持
-
按数据库系统的部署位置不同可分为:
集中式、客户机/服务器式、分布式和并行式
-
-
集中式数据库系统:
- 数据库中的数据和数据处理集中在一台计算机上完成,其他用户可使用终端设备访问数据库,但是终端不参数据库中数据的计算与管理。
-
客户机/服务器(C/S)式数据库系统:
- C/S结构的关键是功能的分解和分布,将功能或任务进行分解,一些功能由客户机完成,另一些功能由服务器执行,即采用“功能分布”的原则。客户端完成本地个性化的处理,并向服务器发送请求,同时显示服务器返回的数据结果;服务器端负责处理公共的部分任务。
-
分布式数据库系统:
- 其数据最显著特点是“逻辑整体性和物理存储分布性”。即通过计算机网络和专门分布式管理软件,将在物理上分布在各个场地的数据库,形成一个逻辑上的整体数据库,用户在使用该数据库时感觉不到数据场地分散性,就象使用一个统一的本地数据库一样。
-
并行数据库系统:
- 是新一代高性能的数据库系统,是在并行处理机(MPP)和集群并行计算环境的基础上建立的数据库系统。
数据库的三级模式结构
数据库系统模式
- 数据模型中有型与值的概念。型指对某一类数据的结构和属性的描述,值是型的一个具体值。
- 模式是对数据逻辑结构和特征的描述,它仅为型的描述,不涉及其具体的值。模式的一个具体值称为模式的一个实例。模式是相对稳定的,而实例是不断变化和更新的。模式反映的是数据的结构及其联系,而实例反映的是数据库某一时刻的状态。
数据库的三级模式结构
-
外模式,模式,内模式
-
其中还提供了(外模式/模式映像、模式/内模式)二级映像,保证数据的逻辑和物理独立性。
-
外模式:也称子模式或用户模式,是局部数据的逻辑结构和特征的描述。外模式是模式的子集,一个数据库可以有多个外模式,是各个用户的数据视图。外模式是数据库安全的一个有力保障措施。每个用户只能访问和外模式中对应的数据。通常情况下,DBMS提供外模式描述语言(DDL)来定义外模式。
-
模式:也称逻辑模式、概念模式或概念视图,是数据库中所有数据的逻辑结构和特征的描述,是用户的公共数据视图,是数据库系统模式结构的中间层,与硬件和软件环境无关。一个数据库只有一个模式,是数据的逻辑表示,即描述数据库中存储具体的数据及其之间存在的联系。DBMS提供外模式描述语言(DDL)来定义模式。
-
内模式:也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表达方式,对应于实际存储在外存储介质上的数据库。如记录的存储方式是顺序存储还是链式或堆存储,数据是否压缩存储与加密等。一个数据库只有一个内模式。DBMS提供内模式描述语(DDL)来严格定义内模式。
-
二级映像:
- **外模式/模式映像定义了外模式和模式之间的对应关系。**外模式描述数据的局部逻辑结构,模式描述数据的全局逻辑结构。数据库中的同一模式可以有多个外模式,对于每个外模式,都存在一个外模式/模式映像。
- 外模式和模式之间的对应关系称为映像。这些映像确定了数据的局部逻辑结构与全局逻辑结构之间的对应关系。
- 当模式改变时(如增加新关系、新属性等),由数据库管理系统对个外模式/模式映像作相应改变,可保证外模式不变。
- 应用程序是根据数据的外模式编写的,外模式没有变应用程序不需要修改,保证了数据的逻辑独立性(数据与程序之间的逻辑独立性)。
- 模式/内模式映像定义了数据的全局逻辑结构与存储结构之间的对应关系。数据库中的模式和内模式都只有一个,因此模式/内模式映像也是唯一的。应用程序依赖于数据的外模式,与数据的模式和存储结构独立,**当数据库的存储结构发生了变化时,只需要数据管理员对模式/内模式的映像做相应改变,可以使模式保持不变,**从而保证用户程序不需要改变,保证了数据的物理独立性。
- 数据与应用程序之间相互独立,可使数据的定义、描述和存取等问题与应用程序进行分离。此外,由于数据的存取由DBMS实现,用户不必考虑存取路径等问题,可以简化应用程序的编写,也减少应用程序的维护和修改。
- **外模式/模式映像定义了外模式和模式之间的对应关系。**外模式描述数据的局部逻辑结构,模式描述数据的全局逻辑结构。数据库中的同一模式可以有多个外模式,对于每个外模式,都存在一个外模式/模式映像。
数据库管理系统
工作模式
- DBMS是对数据库进行统一操纵和管理的大型数据管理软件,主要功能是建立、使用和维护数据。它是数据库系统的核心和关键。用于统一管理控制数据库系统中的各种操作,包括数据定义、查询、更新及各种管理与控制,都是通过DBMS进行的。
具体工作模式如下:
1)接收应用程序的数据请求和处理请求。
2)将用户的查询数据请求(高级指令)转换成复杂的低层指令
3)低层指令实现对数据库的具体操作。
4)接收数据库操作得到的查询结果。
5)对查询结果进行处理,包括相应的格式转换。
6)将处理结果返回给用户。