数据库知识点概要

绪论

1.1 数据库系统概述

1.1.1 四个基本概念
数据(Data)

数据(Data)是数据库中存储的基本对象

数据的定义
描述事物的符号记录
能够由计算机处理的数据、文本、图形、图像、音频、视频、学生的档案记录等

数据的含义称为数据的语义,数据与其语义是不可分的

数据库(Database)

数据库的定义
数据库(Database,简称DB)是长期储存在计算机内、有组织的、可共享的大量数据的集合

数据库的基本特征
数据按一定的数据模型组织、描述和储存
可为各种用户共享
冗余度较小
数据独立性较高
易扩展

数据库管理系统(DBMS)

位于用户与操作系统之间的一层数据管理软件。
是基础软件,是一个大型复杂的软件系统
科学地组织和存储数据、高效地获取和维护数据
例如Orcale、SQL Server、 MySQL、Access

数据定义功能
提供数据定义语言(DDL)
定义数据库中的数据对象
数据组织、存储和管理
分类组织、存储和管理各种数据
确定组织数据的文件结构和存取方式
实现数据之间的联系
提供多种存取方法提高存取效率

数据操纵功能
提供数据操纵语言(DML)
实现对数据库的基本操作 (查询、插入、删除和修改)

数据库的事务管理和运行管理
数据库在建立、运行和维护时由DBMS统一管理和控制
保证数据的安全性、完整性、多用户对数据的并发使用
发生故障后的系统恢复

数据库的建立和维护功能(实用程序)
数据库初始数据装载转换
数据库转储
介质故障恢复
数据库的重组织
性能监视分析等
其它功能
DBMS与网络中其它软件系统的通信
两个DBMS系统的数据转换
异构数据库之间的互访和互操作

数据库系统(DBS)

什么是数据库系统(Database System,简称DBS)
在计算机系统中引入数据库后的系统构成

数据库系统的构成
数据库
数据库管理系统(及其开发工具)
应用系统
数据库管理员

数据库系统的特点

数据结构化
数据的共享性高,冗余度低,易扩充
数据独立性高
数据由DBMS统一管理和控制

1.1.2 数据管理技术的产生和发展

什么是数据管理
对数据进行分类、组织、编码、存储、检索和维护
数据处理的中心问题

数据管理技术的发展过程
人工管理阶段(20世纪40年代中–50年代中)
文件系统阶段(20世纪50年代末–60年代中)
数据库系统阶段(20世纪60年代末–现在)

数据管理技术的发展动力
应用需求的推动
计算机硬件的发展
计算机软件的发展

人工管理阶段

特点
数据的管理者:用户(程序员),数据不保存
数据面向的对象:某一应用程序
数据的共享程度:无共享、冗余度极大
数据的独立性:不独立,完全依赖于程序
数据的结构化:无结构
数据控制能力:应用程序自己控制

文件系统阶段

特点
数据的管理者:文件系统,数据可长期保存
数据面向的对象:某一应用程序
数据的共享程度:共享性差、冗余度大
数据的结构化:记录内有结构,整体无结构
数据的独立性:独立性差,数据的逻辑结构改变必须
修改应用程序
数据控制能力:应用程序自己控制

数据库阶段

特点:
数据高度结构化
数据共享性高
高度数据独立性
具有专门管理系统:数据库管理系统(database management system,DBMS)

1.2 数据模型

1.2.1 概念模型

现实世界 信息世界 机器世界

现实世界 -----> 概念模型 数据库设计人员完成

概念模型 ----->逻辑模型 数据库设计人员完成

逻辑模型 -----> 物理模型 由DBMS完成

概念模型的用途
概念模型用于信息世界的建模
是现实世界到机器世界的一个中间层次
数据库设计人员和用户之间进行交流的语言

信息世界中的基本概念

(1) 实体(Entity)
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
例如:一个学生、一门课等
(2) 属性(Attribute)
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
例如:学生实体由学号、姓名、专业名、性别等属性组成

(3) 码(Key)
唯一标识实体的属性集称为码。
例如:
一个属性是码:学生的学号就是学生实体的码,学生姓名不是码,因为可能有重名。
属性集合是码:选课实体由学号、课程号、成绩三个属性,码是学号+课程号。

(4) 域(Domain)
属性的取值范围称为该属性的域。
例如:性别域为(男,女)
(5) 实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为实体型
例如:学生(学号、姓名、专业名)是一个实体型

(6) 实体集(Entity Set)
同一类型实体的集合称为实体集
例如:全体学生
(7) 联系(Relationship)
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系

1.2.2 数据模型

在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。
通俗地讲数据模型就是现实世界的模拟。

数据模型应满足三方面要求
能比较真实地模拟现实世界
容易为人所理解
便于在计算机上实现

数据模型的组成要素

数据结构
数据操作
完整性约束条件

什么是数据结构
描述数据库的组成对象,以及对象之间的联系

描述的内容
与数据类型、内容、性质有关的对象
与数据之间联系有关的对象

数据结构是对系统静态特性的描述

数据操作
对数据库中各种对象(型)的实例(值)允许执行的
操作及有关的操作规则
数据操作的类型
查询
更新(包括插入、删除、修改)

数据的完整性约束条件
一组完整性规则的集合。
完整性规则:给定的数据模型中数据及其联系所具有的制约和储存规则
用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。

最常用的数据模型

层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model)
面向对象模型(Object Oriented Model)

层次模型

层次模型是数据库系统中最早出现的数据模型
层次数据库系统的典型代表是IBM公司的IMS(Information Management System)数据库管理系统
层次模型用树形结构来表示各类实体以及实体间的联系

层次模型的优缺点

优点
层次模型的数据结构比较简单清晰
查询效率高,性能优于关系模型,不低于网状模型
层次数据模型提供了良好的完整性支持
缺点
多对多联系表示不自然
对插入和删除操作的限制多,应用程序的编写比较复杂
查询子女结点必须通过双亲结点
由于结构严密,层次命令趋于程序化

网状模型

网状数据库系统采用网状模型作为数据的组织方式
典型代表是DBTG系统:
亦称CODASYL系统
70年代由DBTG提出的一个系统方案
奠定了数据库系统的基本概念、方法和技术
实际系统
Cullinet Software Inc.公司的 IDMS
Univac公司的 DMS1100
Honeywell公司的IDS/2
HP公司的IMAGE

网状模型
满足下面两个条件的基本层次联系的集合:

1允许一个以上的结点无双亲;

2一个结点可以有多于一个的双亲。

网状数据模型的优缺点

优点
能够更为直接地描述现实世界,如一个结点可以有多个双亲
具有良好的性能,存取效率较高

缺点
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
DDL、DML语言复杂,用户不容易使用

关系模型

关系数据库系统采用关系模型作为数据的组织方式
1970年美国IBM公司San Jose研究室的研究员E.F.Codd首次提出了数据库系统的关系模型
计算机厂商新推出的数据库管理系统几乎都支持关系模型

关系数据模型的数据结构

关系(Relation)
一个关系对应通常说的一张表
元组(Tuple)
表中的一行即为一个元组
属性(Attribute)
表中的一列即为一个属性,给每一个属性起一个名称即属性名

主码(Key)
表中的某个属性组,它可以唯一确定一个元组。
域(Domain)
属性的取值范围。
分量
元组中的一个属性值。
关系模式
对关系的描述
关系名(属性1,属性2,…,属性n)
学生(学号,姓名,年龄,性别,系,年级)

关系数据模型的操纵与完整性约束

数据操作是集合操作,操作对象和操作结果都是关系
查询
插入
删除
更新

关系的完整性约束条件
实体完整性
参照完整性
用户定义的完整性

优点
建立在严格的数学概念的基础上
概念单一
实体和各类联系都用关系来表示
对数据的检索结果也是关系
关系模型的存取路径对用户透明
具有更高的数据独立性,更好的安全保密性
简化了程序员的工作和数据库开发建立的工作

缺点
存取路径对用户透明导致查询效率往往不如非
关系数据模型
为提高性能,必须对用户的查询请求进行优化
增加了开发DBMS的难度

1.3 数据库系统结构

1.3.1 三级模式结构

“型” 和“值” 的概念
型(Type)
对某一类数据的结构和属性的说明
值(Value)
是型的一个具体赋值
例如
学生记录型:
(学号,姓名,性别,系别,年龄,籍贯)
一个记录值:
(900201,李明,男,计算机,22,江苏)

数据库系统模式的概念

模式(Schema)
数据库逻辑结构和特征的描述
是型的描述
反映的是数据的结构及其联系
模式是相对稳定的
实例(Instance)
模式的一个具体值
反映数据库某一时刻的状态
同一个模式可以有很多实例
实例随数据库中的数据的更新而变动

数据库系统的三级模式结构

模式(Schema)

外模式(External Schema)

内模式(Internal Schema)

模式(Schema)

模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述
所有用户的公共数据视图,综合了所有用户的需求
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关

外模式(External Schema)

外模式(也称子模式或用户模式)
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示

外模式的地位:介于模式与应用之间
模式与外模式的关系:一对多
外模式通常是模式的子集
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
对模式中同一数据,在外模式中的结构、类型、长度、保密级别

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值