元数据是关于数据的数据,用于描述数据。
数据库系统(Database System):由数据库管理系统(DBMS)、数据库(DB)、应用程序(applications)、及数据库管理员(Database Administrator, DBA)组成的系统。
ANSI-SPARC三层体系结构
:外层、概念层和内层
三层体系结构的
目标
是将数据库物理表示和组织方式与数据库的用户视图进行分离,即提供
数据独立性
(
data independence
)。
区分数据库的描述(元数据)与数据库本身(数据)很重要。引入了数据库模式(database schema)和数据库实例(database instance)两个不同的概念。前者相对稳定,后者经常变动。
数据库的(总体)描述称为数据库模式,也称数据库的内涵(intension)。
数据库中特定时间点的数据称为数据库实例(database instance)或状态(state),也称数据库的外延(extension)。
ANSI-SPARC
三层抽象
数据库中的三种数据模式:
外模式(external schema)或称子模式(subschema):分别描述数据的不同视图
概念模式(conceptual schema):描述数据库中所有实体、属性与关系,以及完整性约束
内模式(internal schema):描述数据库的内部模型,包括数据域与存储记录的定义、表示方法、索引与存储结构等
多级数据模型
(
multi-level data model
)
概念数据模型(conceptual data model
)
面向现实世界/
用户,与
DBMS
无关
e.g. E-R
模型、
O-O
模型
逻辑数据模型(logical data model
)
既面向用户、又面向实现
e.g.
网状模型、层次模型、关系模型、
O-O
模型
物理数据模型(physical data model
)
面向机器世界/
实现,描述数据的存储结构。与
DBMS
、
OS
、硬件有关
对关系也要区分其型(Type)和值
(Value),
其型称为关系的
模式
(Schema)/
内涵
(Intension);
其值称为关系的
实例
(Instance)/
外延
(Extension)。
关系中满足如下两个条件的属性(组)称为此关系的
候选键
(candidate key)
,
或简称
键
(Key):
a. 决定性条件
:这个属性(组)的值唯一地决定了其他属性的值(因而也决定了整个元组);
b. 最小性条件:
这个属性(组)的任何真子集均不满足决定性条件。
关系中包含键的属性(组)称为
超键
Superkey
从一个关系中(多个)键中选定一个作为此关系模式的键,称被选定者为
主键
(Primary Key, PK)
。其他键称为
候补键
(Alternate Key)
。