数据库系统基础知识

目录

数据库系统基础知识

基本概念

数据库的结构

常用的数据模型

概念数据模型

基本数据模型

面向对象模型

数据的规范化

函数依赖

范式

事务管理

并发控制

数据库的备份和恢复

备份(转储)与恢复

备份分类

数据库的四类故障

关系数据库设计

分布式数据库系统

商业智能BI


数据库系统基础知识

基本概念

DB:数据库.是指长期储存在计算机内的,有组织的,可共享的数据集合.

DBS:数据库系统.由数据库,硬件,软件和人员组成,管理的对象是数据.

DBMS:数据库管理系统.是一种操纵和管理数据库的大型软件,用于建立,使用和维护数据库.DBMS通常分三类:关系数据库系统RDBS,面向对象的数据库系统OODBS,对象关系数据库系统ORDBS.

DBA:数据库管理员.

数据库技术中采用分级的方法,将数据库的结构划分为多个层次,最著名的是三级划分法,将数据库系统分为外模式,概念模式内模式三个层次.

数据库的结构

数据库结构的基础是数据模型,使用来描述数据的一组概念和定义.

数据模型的三要素:数据结构,数据操作,数据的约束条件.

常用的数据模型

概念数据模型

概念数据模型又称为实体联系模型,它按照用户的观点来对数据和信息建模,主要用于数据库设计.

概念模型主要用实体-联系方法表示,简称E-R方法.

E-R模型简称E-R图,E-R图的三个要素有:

  1. 实体(型):矩形框表示,框内标注实体名称.
  2. 属性:椭圆形表示,并用连线和实体连接起来.
  3. 实体之间的联系:菱形框表示,框内标注联系名称,用连线将菱形框分别与有关实体相连,并在连线上注明联系类型.

基本数据模型

基本数据模型又称为结构数据模型,是按照计算机系统的观点来对数据和信息建模.主要用于DBMS的实现.

基本数据模型是数据库系统的核心和基础,通常由数据结构,数据操作完整性约束三部分组成.

面向对象模型

面向对象观点来描述现实世界实体的逻辑结构,对象间限制,联系等的模型.

数据的规范化

函数依赖

函数依赖:设R(U)是属性U上的一个关系模式,X和Y是U的子集,r是R的任一关系,如果对于r中的任意两个元组u和v,只要有u[X]=v[X],则称X函数决定Y,或称Y函数依赖于X,记为X→Y.

关系数据库设计理论的核心就是数据间的函数依赖.

范式

  • 第一范式1NF:如果关系模式R的多个关系r的属性值都是不可分的原子值,那么称R是第一范式的模式,r是规范化的关系.
  • 第二范式2NF:如果关系模式R是1NF,且每个非主属性完全函数依赖于候选键(消除部分函数依赖),那么称R是2NF模式.
  • 第三范式3NF:如果关系模式R是1NF,且每个非主属性都不传递依赖于R的候选键(消除传递函数依赖),那么称R是3NF.
  • BC范式BCNF:如果关系模式R是1NF,且每个属性都不传递函数依赖于R的候选键,那么称R是BCNF模式.

BCNF⊂3NF⊂2NF⊂1NF.

事务管理

事务是用户定义的一个数据库操作序列,这些操作序列要么全做,要么全都不做,是一个不可分割的工作单位.

事务的四个特性(ACID):

  • 原子性:事务的所有操作在数据库中要么全做,要么全都不做.
  • 一致性:事务的执行使数据库从一个一致性状态变成另一个一致性状态.
  • 隔离性:一个事务的执行不能被其他事务干扰.
  • 持续性/永久性:指一个事务一旦提交,它对数据库的改动必须是永久的,即使系统出现故障时也是如此.

并发控制

并发控制可以保证数据库的完整性不收破坏,同时避免用户得到不正确的数据.

并发控制的主要技术是封锁,主要有两种类型的封锁:X封锁(排他)和S封锁(共享).

数据库的备份和恢复

备份(转储)与恢复

备份是指通过数据转储和监理日志文件的方法监理冗余数据,这些备用数据称为后备副本.

恢复是指把数据库从错误状态恢复到一个已知的正确状态的功能.

备份分类

  • 静态备份:指备份期间不允许对数据库进行任何存取,修改活动.
  • 动态备份:指备份期间允许动数据库进行存取或修改.
  • 海量备份/完全备份/全量备份:指每次备份全部数据库.
  • 差异备份/差量备份:备份上一次的全量备份后发生变化的所有数据.
  • 增量备份:指每次只备份上次备份后更新过的数据.
星期日星期一星期二星期三星期四星期五星期六
全量备份增量备份增量备份增量备份差异备份增量备份增量备份

数据库的四类故障

数据库的四类故障:事务故障,系统故障,介质故障,计算机病毒.

关系数据库设计

数据库设计:是指对一个给定的应用环境,构造最优的数据库,建立数据库及其应用系统,使之能有效地存储数据,满足各种用户的需求.

数据库设计的特点:从数据结构开始,并以之为核心展开;静态结构设计与动态结构设计分离;试探性;反复性;多步性.

数据库设计方法:直观设计法,规范设计法,计算机辅助设计法,自动化设计法.

数据库设计步骤:需求分析,概念结构设计,逻辑结构设计,物理结构设计,应用程序设计,运行维护.

分布式数据库系统

分布式数据库系统DDBS:针对地理上分散而管理上有需要不同程度集中管理的需求,而提出的一种数据管理信息系统.

分布式数据库系统的特点:数据的集中控制性,数据独立性,数据冗余可控性,场地自治性,存取有效性.

分布式数据库的体系结构:全局外层,全局概念层,局部概念层,局部分层.

商业智能BI

商业智能BI是企业对商业数据的搜集,管理和分析的系统过程,目的是使企业的各级决策者获得知识或洞察力,帮助他们做出对企业更有利的决策.一般认为数据仓库,联机分析处理OLAP数据挖掘是商业智能的三大组成部分.

数据仓库是一个面向主题的,集成的,相对稳定且随时间变化的数据集合,用于支持管理决策.

数据仓库的关键特征是:面向主题,集成的,非易失的,时变的.

比较项目传统数据库数据仓库
数据内容当前值历史的,归档的,归纳的,计算的数据(处理过的)
数据目标面向业务操作程序,重复操作面向主体域,分析应用
数据特性动态变化,更新静态,不能直接更新,只能定时添加,更新
数据结构高度结构化,复杂,适合操作计算简单,适合分析
使用频率
数据访问量每个事务一般只访问少量记录每个事务一般访问大量记录
对响应时间的要求计时单位小计时单位相对较大

OLTP与OLAP的比较:OLTP即联机事务处理,OLAP即联机分析处理,是数据仓库的核心部分.区别如下:

项目OLTPOLAP
用户操作人员,低层管理人员决策人员,高级管理人员
功能日常操作处理分析决策
DB设计面向应用面向主题
数据当前的,最新的,细节的,二维的分立的历史的,聚集的,多维的,集成的,统一的
存取读/写数十条记录读上百万条记录
工作单位简单的事务复杂的查询
用户数上千个上百个
DB大小100MB至GB级100GB至TB级

数据挖掘与传统数据分析的区别:数据挖掘是在没有明确假设的前提下去挖掘信息,发现知识.数据挖掘得到的信息应具有先知,有效和可实用三个特征.

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据库系统基础知识 内容提要: Visual Foxpro是目前微机上流行采用了可视化的、面向对象的程序设计方法,大大简化了应用 系统的开发过程,本章是全书的基础,讨论了一些数据库系统基础知识,为后面的学 习打下理论基础。主要从数据库的基本概念、关系数据库及其设计概述、数据库技术的 应用领域及发展方向三个方面进行讨论。 1.数据库的基本概念 1.1信息、数据及数据处理 1) 信息 信息是对现实世界中各种事物的存在方式或运动形态的反映,它反映的是事物之间的联 系。 2) 数据 数据是信息的符号化表示。 3) 数据处理 数据处理实际上就是利用计算机对各种类型的数据进行处理。它包括对数据的采集、整 理、存储、分类、排序、检索、维护、加工、统计和传输等一系列操作过程。 1.2数据库、数据库管理系统与数据库系统 1) 数据库(DataBase,简称DB) 数据库,顾名思义,是存放数据的仓库。它是按一定的结构和组织方式存储在计算机外 部存储介质上的,有结构,可共享的相互关联的数据集合。 数据库中的数据具有结构化好,冗余度小,数据独立性高,共享性高和易于扩充等特点 。 2) 数据库管理系统(DataBase Management System,简称DBMS) 数据库管理系统是一个管理数据库的软件系统。它为用户提供了大量描述(建立)数据 库、操纵(检索、排序、索引、显示、统计计算等)数据库和维护(修改、追加、删除 等)数据库的方法和命令。而且它还能自动控制数据库的安全,及数据库的数据完整。 比如:Visual FoxPro 6.0,SQL Server,Oracle等系统就是数据库管理系统。 其主要功能包括以下几个方面: (1) 数据定义功能 (2) 数据操纵功能 (3) 数据控制功能 (4) 数据库的建立和维护功能 3) 数据库系统(DataBase System,简称DBS) 数据库系统的目标在于存储和提取所需要的信息。它主要由数据、硬件、软件和用户四 部分构成。 1.3数据库管理技术的产生和发展 随着计算机软、硬件技术的发展,在应用需求的推动下,数据管理技术经历了人工管理 、文件系统、数据库系统、分布式数据库系统四个阶段。 1.4数据模型(Data Model) 数据模型的组成要素 数据库的数据模型包含数据结构、数据操作和完整性约束三大要素。其中: 1)数据结构:是指对实体类型和实体间联系的表达和实现。 2)数据操作:是指对数据库的检索和更新操作的实现。 3)数据的完整性约束:是指给出数据及其联系所具有的制约和依赖规则。 1.4.2 概念模型 概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人 员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言,因此 概念模型一方面应该具有较强的语义表达能力,另一方面还应该简单,清晰,易于用户 理解。 1)基本概念 实体:客观存在并可相互区别的事物。 属性:实体所具有的某一特性。 码: 一个实体的各属性中,可以唯一标识实体的属性,这个属性可以是一个,也可以是多个 。 域:属性的取值范围。 实体集:用同一类实体的实体名和属性名抽象和刻画同一类实体。 联系:在现实世界中,事物内部及事物间的联系在信息世界里反映为实体(集)内部及 实体(集)间的联系。 2)概念模型的表示方法 实体-联系模型(E- R模型)是P.P.Chen于1976年提出的。这个模型直接从现实世界中抽象出实体类型及实体 间的联系,然后用E-R图表示数据结构。 E-R图是直观表示概念模型的工具。具体表示方法为: 实体型:用矩形表示,矩形框内标明实体名; 属性:用椭圆形表示,并用无向边将其与实体连接起来; 联系:用菱形表示,菱形框内标明联系名,并用无向边连接有关实体,同时在无向边旁 标明联系类型。 3)实体间的联系 实体间的联系主要有两实体、两个以上实体及同一实体几种情况,下面分别举例介绍, 最后给出一个学生教学管理系统实例。 (1)两实体间的联系 两实体间的联系类型可以分为三种:一对一联系(1:1)、一对多联系(1:n)、多对 多联系(n:n)。 (2) 两以上实体间的联系 两个以上的实体型之间也存在着一对一、一对多、多对多联系。 (3) 同一个实体内部的联系 同一个实体集内的各个实体之间也可以存在着一对一、一对多、多对多联系。 4)具体实例 在"学生教学管理系统"中,一个系有若干名教师,若干名学生,每个教师可以开设若干 门课程,每门课程可以由若干名教师讲授;每名学生可以选修若干门课程,每门课程也 可由多个学生选修。 1.4.3 结构模型 为了反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构 用结构模型来表示。结构模型是数据库管理系统用来表示数据与数据联系的方法。 在这里
Visual FoxPuo 程序设计基础 第1章 数据库系统基础知识 数据库基础知识 1.1 数据模型 1.2 数据库系统 1.3 关系数据库 1.4 数据库系统的体系结构与开发工具 1.5 1.1 数据库基础知识 通常,把用计算机对数据进行处理的应用 系统称为计算机信息系统,其核心是数据库。 本节将介绍数据库中的一些基本知识。 1.1.1 信息与数据 信息具有如下重要特征。 (1)信息具有表征性。 它能够表达事物的属性、运动特征及状态。 (2)信息具有可传播性。 信息可以进行获取、存储、传递和共享。 (3)信息具有可处理性。 信息可以进行压缩、加工以及再生。 (4)信息具有价值性和可转换性。 与信息相关的是数据。 数据是信息的具体表现形式,是信息的 载体。 在实际应用中,数据的表示形式有两种: 一种是可以参与数值运算的数值型数据,如表 示工资、成绩的数据;另一种是由不能参与数 值运算的数据,如字符(文字和符号)、图表 (图形、图像和表格)、动画、影像、声音等 多媒体数据。 数据有两方面的特征:一是客体属性的 反映,这是数据的内容;二是记录信息的 符号,这是数据的形式。 形式是内容的表现方式,内容是形式的 实质。 1.1.2 数据处理 数据处理是指将数据转换成信息的过 程,数据处理也可称为信息处理。 它包括对数据的采集、整理、存储、 分类、检索、排序、统计、维护、传输等一 系 列活动。 通常将数据处理分为两个操作层次:一 是数据采集、分类、组织、编码、存储、检 索、传输、维护等基本操作,这些基本操作 称为数据管理;二是加工、计算、输出等操 作,管理对象不同,操作的要求也不同。 根据处理设备的结构和工作方式以及数 据分布方式的不同,数据处理的方式主要有 以下4种。 (1)按处理设备的结构方式分,可分 为联机处理方式和脱机处理方式。 (2)按数据处理时间的分配方式分, 可分为批处理方式、分时处理方式和实 时处理方式。 (3)按数据处理空间的分布方式分,可 分为集中式处理方式和分布处理方式。 (4)按计算机中央处理器的工作方式分, 可分为单道作业处理方式、多道作业处理 方式和交互式处理方式。 1.1.3 数据库管理技术的发展 1.数据库的概念 数据库(DataBase)是依照某种数据 模型组织起来的、相互关联的、并存放于 二级存储器中的数据集合。 由于数据库本身的数据结构特征,使 得数据库独立于使用它的应用程序,对数 据的增加、删除、修改和检索则由相关的 软件进行管理和控制,从而实现了数据和 操作的分离。 将所有数据集中存放在数据库中,一方 面便于人们对其进行统一管理,另一方面也 便于人们提炼出对决策有用的数据和信息。 2.数据库的产生 实际上,数据库系统并不是和计算机 同时出现的,而是随着计算机硬件技术和 软件技术的发展,以及社会对数据处理需 求的不断发展而产生的。 计算机数据管理的方式也在不断改进, 经历了从人工管理到文件系统再到数据库 系统3个阶段。 (1)人工管理阶段。 20世纪50年代中期以前,计算机主要用 于科学计算,数据量较少,一般不需要长 期保存。 该阶段主要存在以下几方面的问题。 数据不能长期保存。 数据不独立。 数据不能重复使用。 (2)文件系统阶段。 20世纪50年代后期到60年代中期,计 算机开始大量用于数据管理。 文件系统提供了在外存储器上长期保存 数据并对数据进行存取的手段。 文件的逻辑结构与存储结构有一定的区 别,即程序与数据具有一定的独立性。 数据的存储结构变化,不一定影响程 序,因此程序员可集中精力进行算法的设 计,大大减少了维护程序的工作量。 文件系统阶段存在着以下几个问题。 数据冗余度大。 数据独立性差。 缺乏对数据的集中管理。 (3)数据库系统阶段。 20世纪60年代后期,随着计算机技术的 发展,计算机在管理中应用越来越广泛,规 模越来越庞大,数据量急剧增加,数据共享 性更强。 在数据库系统中,有一种叫做数据库 管理系统(DataBase Mannagement System, DBMS)的系统软件将所有的数 据集中到一个数据库中,形成一个数据中 心,对数据进行统一的控制。 3.数据库的特点 数据库具有数据共享、数据独立、最 小冗余、数据安全、数据完整、灵活性、 可恢复性等特点。 (1)数据共享。 (2)数据独立性强。 (3)数据冗余度小。 (4)数据结构化。 1.2 数 据 模 型 数据模型是描述数据及数据之间联系 的结构形式,它主要研究如何组织数据库 中的数据,这是数据库的核心内容。 1.2.1 基本概念 人们把客观存在的事物以数据的形式 存储到计算机中,经历了对现实生活中事 物特征的认识、概念化到计算机数据库里 的具体表示形式的逐级抽象过程。 实体模型也称概念模型或信息模型, 它是按用户

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值