目录
1. 理解数据处理
1、数据:是用来记录信息的可识别的符号,是信息的具体表现形式。数据用型和值来表示,数据的型是指数据内容存储在媒体上的具体形式;值是指所描述的客观事物的具体特性。
2、数据处理:是指将数据转换成信息的过程,也称信息处理。数据处理的工作分为3个方面:数据管理、数据加工、数据传播。
2. 理解数据描述
1、信息世界是现实世界在人们头脑中的反映。
2、信息世界有以下相关术语:实体(可以是具体的事物,也可以是抽象的事件)、属性、码(唯一标识实体的属性或属性的组合)、域、实体型、实体集、联系(实体型之间的联系分为3类:一对一联系、一对多联系、多对多联系)。
3. 掌握数据模型
1、数据模型的分类
(1)概念数据模型(面向人员):简称为概念模型,表示实体类型及实体间的联系。是现实世界的第1层抽象。
(2)结构数据模型(面向数据库):简称为数据模型,它是直接面向数据库的逻辑结构,是现实世界的第2层抽象。
2、概念模型
(1)E-R模型是使用最广泛的概念模型。通常用矩形框表示实体型,用椭圆形框表示实体的属性,用菱形框表示实体间的联系。
例如:
(2)用E-R图表示的概念模型与数据模型相互独立,是各种数据模型的共同基础。
3、数据模型的三要素
(1)数据结构:包括数据本身、数据之间的联系。
(2)数据操作:主要有检索(读)和更新(写)两类。
(3)数据约束条件:是一组完整性规则的集合。
4、常见的数据模型
层次模型、网状模型、关系模型
5、关系模型
关系模型是目前最重要的一种数据模型,关系数据库系统采用关系模型作为数据的组织方式。
(1)关系模型的数据结构(节选)
1.关系:一个关系就是一张二维表
2.元组:也称记录,关系表中的一行对应一个元组
3.属性:表中的一列即为一个属性
(2)关系的性质
1. 同一属性的数据具有同质性。2. 同一关系的属性名具有不可重复性。3. 关系中列的位置具有顺序无关性。4. 关系具有元组无冗余性。5. 关系中元组的位置具有顺序无关性。6. 关系中每个分量必须取原子值。
(3)关系的每个分量必须是一个不可分割的数据项。
6、关系的完整性
(1)实体完整性:实体完整性规则规定,基本关系的所有主属性都不能取空值,而不仅是指主键不能取空值。
外键的定义:设A是关系B的一个属性,但不是关系B的主键,而是关系C的主键,则称A为关系B的外键。
(2)参照完整性:关系的属性之间存在参照、引用。
(3)用户自定义的完整性
4. 掌握关系代数
1、基本概念
关系代数是一种抽象查询语言。运算对象、运算符、运算结果是运算三大要素。关系代数的运算对象是关系,运算结果也是关系。
2、关系代数运算符
关系代数使用的运算符包括:集合运算符、专门的关系运算符、比较运算符和逻辑运算符。
3、传统的集合运算
(1)并:关系R与关系S的并 记作:
(t是元组变量)
(2)差:关系R与关系S的差 记作:
(3)交:关系R与关系S的交 记作:
(4)广义笛卡尔积:两个分别为n目和m目的关系R和S的广义笛卡儿积是一个(n + m)列的元组的集合。若R有k1个元组,S有k2个元组,则关系R和关系S的广义笛卡儿积有kl×k2个元组。记作:
例图如下:
4、专门的关系运算
(1)选择(行的角度):选择又称为限制,就是筛选条件。
记作: (其中F表示选择条件)
(2)投影(列的角度):R的投影是从R中选择出若干属性列来组成新的关系。记作: (其中A是R的属性列)
(3)连接:连接也称为θ连接,它是从两个关系的笛卡儿积中选取属性间满足一定条件的元组。
记作: (其中A和B分别为R和S上数目相等且可比的属性组,θ是比较运算符。
连接运算中最重要、最常用的连接:等值连接、自然连接。
5. 明确数据库系统的组成和结构
1、数据库:是长期存放在计算机内、有组织的、可共享的相关数据的集合,具有较小的冗余度、较高的数据独立性和易扩展性、可被各类用户共享等特点。
2、数据库管理系统的主要功能:(1)数据定义功能(2)数据操纵功能(3)数据库的运行管理(4)数据库的创建和维护功能
3、数据库的体系结构:数据库的体系结构分为三级模式和两级映像。三级结构之间的差别往往很大,为了实现这3个抽象级别的联系和转换,DBMS在三级结构之间提供了两级映像:外模式/模式映像、模式/内模式映像。正是这两级映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
(1)模式:一个数据库只有一个模式。
(2)外模式:一个数据库可以有多个外模式。外模式是保证数据库安全性的一个有效措施。
(3)内模式:一个数据库只有一个内模式。内模式的目标是设计最优的物理模式,以提高数据的存取效率,改善系统的性能指标。
(4)外模式/模式映像:对于每个外模式,数据库系统都有一个外模式/模式映像。
(5)模式/内模式映像:数据库中只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的。
(6)两级数据独立性:是指应用程序和数据库的数据结构之间相互独立,不受影响。分为:逻辑数据独立性、物理数据独立性。