三代演变:
层次/网状系统、关系型系统、后关系型数据库
1.1数据与信息
数据
数据描述现实世界中各种具体实物或抽象概念的、可存储并具有明确意义的符号记录
对数据的解释称为语义,数据与语义是不可分的(一组数据不同的语义所带来的意义是完全不同的)
信息
数据的内涵,数据的语义解释
数据处理就变成了信息
数据处理
对数据的收集、存储、分类、加工、检索、维护等一系列活动
目的:从大量的原始数据中抽取和推导出游价值的信息
数据管理技术的发展
概述
三个阶段:
- 人工管理
- 文件系统
- 数据库系统
发展动力:
- 应用需求的推动
- 硬件发展
- 软件发展
三代演变:
- 层次/网络系统
- 关系系统
- 后关系性数据库
文件管理系统特点
特点:
- 数据以文件的形式长期保存在外存储器中数据的独立性差
- 由文件系统对数据进行管理
- 数据共享性差,冗余度大
- 数据独立性差
数据库管理阶段
背景:大规模管理,大容量磁盘
解决多用户多应用程序共享的要求
处理方式:联机实时处理,分布处理,批处理
数据库管理系统(DBMS)
特点:
- 数据结构化
- 数据共享性高、冗余度低、易扩充
- 数据独立性高
- 数据由DBMS统一管理和控制
数据库系统基本概念
数据库(DB)
长期储存在计算机内、有组织的、可共享的、大量数据的集合
数据库管理系统(DBMS)
数据库系统的核心
位于用户与操作系统之间的一层数据管理软件
主要功能包括:
-
数据定义功能(CREATE)
-
数据操纵功能(INSERT,UPDATE,DELETE)
-
数据组织、存储和管理
-
数据库运行管理
-
数据库的建立和维护功能
-
其他功能(数据转换功能、异构数据库之间的互访和互操作功能)
数据库应用系统
以数据库为基础
有GUI
数据库用户
管理员(DBA)(重要):
专业技术人员,最高操作权限
系统分析人员
负责应用系统的需求分析和规范说明,参与概要设计
数据库设计人员
应用程序开发人员
数据库系统
组成:
- 数据库
- 数据库管理系统(及其开发工具)
- 应用系统
- 数据库管理员DBA和用户
数据库模型
模型,对现实世界某个对象特征的抽象
三个世界
现实世界、信息世界、机器世界
信息世界
基本概念:
- 实体:客观存在,可相互区分(可以操作的对象,粒度的划分)
- 属性:实体的某一特征(员工的员工号、员工名)
- 码(键):唯一标识实体的属性或属性的组合(员工的员工号,与属性值的区分?)
- 域:属性值的取值范围
- 实体型:实体名及其所有属性的集合来描述实体(员工(员工号,员工名…))
- 实体集:同一类型实体的集合成为实体集(全体员工)
- 联系:事物内部及事物之间(在此不讨论实体之间的联系,不讨论内部的联系)
两个实体集之间的联系
- 1:1联系
- 1:n联系
- m:n联系
三个或三个以上实体集之间的联系
单个实体集之间的联系![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/a6ffc9de23f609def0678719d7ff98f7.png)
概念模型的表示方法
ER图
- 矩形表示实体
- 椭圆表示属性
- 菱形表示联系
机器世界
- 字段:标记实体属性的单位名称(往往和属性名相同)
- 记录:字段的有序集合(一名员工(201801,张三))
- 文件:同一类记录的集合(所有员工的记录)
- 关键字(键):唯一识别文件中的每条记录的字段或字段集
三个世界的各种术语的对应关系
现实世界 | 信息世界 | 机器世界 |
---|---|---|
事物个体 | 实体 | 记录 |
事物总体 | 实体集 | 文件 |
事物特征 | 属性 | 字段 |
事物之间的联系 | 概念模型 | 数据模型 |
数据模型的组成要素
数据结构、数据操作、完整性约束
常用数据模型
-
层次模型(非关系模型)
-
网状模型(非关系模型)
-
关系模型
关系模型
基本概念:
- 关系:一个关系对应一张规范的二维表(表中不能含表)
员工号 | 姓名 | 应发工资 | 扣除款项 | 实发工资 | |||
---|---|---|---|---|---|---|---|
基本工资 | 职务工资 | 津贴 | 养老金 | 失业金 | |||
2018101 | 沈鸿 | 1780 | 900 | 500 | 300 | 20 | 2860 |
2018201 | 孙波 | 1830 | 950 | 500 | 320 | 21 | 2939 |
2018202 | 赵月 | 1755 | 850 | 500 | 280 | 19 | 2806 |
- 元组:一行即为一个元组
- 属性:一列即为一个属性,列名即是属性名,列值即是属性值属性
- 域:属性的取值范围。
- 分量:元组中的一个属性值。
- 码(Key):属性或属性的组合,能唯一确定一个元组。一个关系中可以有多个码。
- 关系模式:对关系的描述,表示为:关系名(属性1,属性2,…,属性)
操作:查询、插入、删除、更新
完整性约束:
- 实体完整性
- 参照完整性
- 用户自定义完整性
特点:
- 集合为对象
- 存取路径对用户是隐藏的;提高数据的独立性
数据库系统内部结构
三级模式
-
外模式
-
模式
-
内模式
二级映像
-
外模式/模式
-
模式/内模式
外模式
二级映像与数据的独立性
数据的逻辑独立性、数据的物理独立性
数据库外部结构
-
单用户结构
- 缺点:一个用户独占
- 优点:可操作性、易开发、简单管理
-
主从式结构
- 优点:结构简单
- 缺点:全部任务由主机完成,对主机的性能要求较高;主机瘫痪全部瘫痪(使用冗余解决)
-
客户/服务器结构
- 两层CS
- 划分为前台和后台
- 前台客户机;存放应用程序和相关开发工具,负责与客户接口的相关任务,主要完成表示逻辑和业务逻辑
- 后台由数据库服务器:存放DBMS和数据库,负责数据库的管理
- 三层C/S增加了服务器专门负责完成业务逻辑
- 两层CS
-
Browser/Server,B/S
-
分布式
- 特点:
- 数据在物 理上是分布存储的
- 所有的数据在逻辑上是整体的
- 节点上分布存储的数据相对独立
- 特点:
痪全部瘫痪(使用冗余解决)
- 客户/服务器结构
- 两层CS
- 划分为前台和后台
- 前台客户机;存放应用程序和相关开发工具,负责与客户接口的相关任务,主要完成表示逻辑和业务逻辑
- 后台由数据库服务器:存放DBMS和数据库,负责数据库的管理
- 三层C/S增加了服务器专门负责完成业务逻辑
- 两层CS
- Browser/Server,B/S
- 分布式
- 特点:
- 数据在物 理上是分布存储的
- 所有的数据在逻辑上是整体的
- 节点上分布存储的数据相对独立
- 特点: