1.数据库的基本概念和基本作用是如何?
数据库(Database)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。
简单来说是本身可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。
2.了解数据库的发展历史和各种数据模型?
发展历史:
使用计算机后,随着数据处理量的增长,产生了数据管理技术。数据管理技术的发展与计算机硬件(主要是外部存储器)系统软件及计算机应用的范围有着密切的联系。数据管理技术的发展经历了以下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段。
人工管理阶段
20世纪50年代中期之前,计算机的软硬件均不完善。硬件存储设备只有磁带、卡片和纸带,软件方面还没有操作系统,当时的计算机主要用于科学计算。这个阶段由于还没有软件系统对数据进行管理,程序员在程序中不仅要规定数据的逻辑结构,还要设计其物理结构,包括存储结构、存取方法、输入输出方式等。当数据的物理组织或存储设备改变时,用户程序就必须重新编制。由于数据的组织面向应用,不同的计算程序之间不能共享数据,使得不同的应用之间存在大量的重复数据,很难维护应用程序之间数据的一致性。
这一阶段的主要特征可归纳为如下几点:
(1)计算机中没有支持数据管理的软件,计算机系统不提供对用户数据的管理功能,应用程序只包含自己要用到的全部数据。
(2)数据不能共享。
(3)不能单独保存数据。
文件系统阶段
这一阶段的主要标志是计算机中有了专门管理数据库的软件——操作系统(文件管理)。
上世纪50年代中期到60年代中期,由于计算机大容量直接存储设备如硬盘、磁鼓的出现,
推动了软件技术的发展,软件的领域出现了操作系统和高级软件,操作系统中的文件系统是专门管理外存的数据管理软件,操作系统为用户使用文件提供了友好界面。操作系统的出现标志着数据管理步入一个新的阶段。在文件系统阶段,数据以文件为单位存储在外存,且由操作系统统一管理,文件是操作系统管理的重要资源。
文件系统阶段的数据管理具有一下几个特点:
优点
(1)数据以“文件”形式可长期保存在外部存储器的磁盘上。
(2)数据的逻辑结构与物理结构有了区别,程序和数据分离,使数据与程序有了一定的独立性,但比较简单。
(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。
(5)用户的程序与数据可分别存放在外存储器上,各个应用程序可以共享一组数据,实现了以文件为单位的数据共享文件系统。
(6)对数据的操作以记录为单位。
(7)数据处理方式有批处理,也有联机实时处理。
数据库系统阶段
20世纪60年代后期,随着计算机在数据管理领域的普遍应用,人们对数据管理技术提出了更高的要求:希望面向企业或部门,以数据为中心组织数据,减少数据的冗余,提供更高的数据共享能力,同时要求程序和数据具有较高的独立性,当数据的逻辑结构改变时,不涉及数据的物理结构,也不影响应用程序,以降低应用程序研制与维护的费用。数据库技术正是在这样一个应用需求的基础上发展起来的。
概括起来,数据库系统阶段的数据管理具有以下几个特点:
(1)采用数据模型表示复杂的数据结构。
(2)由于面对整个应用系统使得,数据冗余小,易修改、易扩充,实现了数据贡献
(3)对数据进行统一管理和控制,提供了数据的安全性、完整性、以及并发控制。
(4)程序和数据有较高的独立性。
(5)具有良好的用户接口,用户可方便地开发和使用数据库。
数据模型:
按照数据模型的特点将传统数据库系统分成网状数据库、层次数据库和关系数据库三类。
最早出现的网状DBMS,是美国通用电气公司Bachman等人在1961年开发的IDS(Integrated Data Store)。1964年通用电气公司(General ElectricCo.)的Charles Bachman 成功地开发出世界上第一个网状DBMS也即第一个数据库管理系统——集成数据存储(Integrated Data Store IDS),奠定了网状数据库的基础,并在当时得到了广泛的发行和应用。IDS 具有数据模式和日志的特征,但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工编码生成。之后,通用电气公司一个客户——BF Goodrich Chemical 公司最终不得不重写了整个系统,并将重写后的系统命名为集成数据管理系统(IDMS)。
网状数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据库占有重要地位。
层次型DBMS是紧随网络型数据库而出现的,最著名最典型的层次数据库系统是IBM 公司在1968 年开发的IMS(Information Management System),一种适合其主机的层次数据库。这是IBM公司研制的最早的大型数据库系统程序产品。从60年代末产生起,如今已经发展到IMSV6,提供群集、N路数据共享、消息队列共享等先进特性的支持。这个具有30年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。
网状数据库和层次数据库已经很好地解决了数据的集中和共享问题,但是在数据独立性和抽象级别上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明确数据的存储结构,指出存取路径。而后来出现的关系数据库较好地解决了这些问题。
3.什么是数据库的三级模式?在三级模式中如何实现映射?
三级模式
外模式:应用程序用到的部分数据的逻辑结构。一个数据库可以有多个外模式
概念模式(模式、逻辑模式):数据库管理员用到的视图,就是我们在DBMS的可视化
界面中看到的数据库对象。一个数据库只有一个概念模式 www.jb51.net
内模式:数据库的最低层模式,是数据物理结构和存储方式的描述。一个数据库只有一个内模式。
两级映射
外模式-概念模式的映射
概念模式-内模式的映射
三级模式的关系
模式(概念模式)是数据库的核心与关键
内模式依赖于模式,独立于外模式和存储设备
外模式面向具体的应用,独立于内模式和存储设备
应用程序依赖于外模式,独立于模式和内模式
数据库的两级独立性
物理独立性:应用程序与存储在磁盘上的数据库中的数据是相互独立的
逻辑独立性:应用程序和数据库的逻辑结构相互独立 www.jb51.net
注意:逻辑独立比物理独立难实现
两级独立性依赖于两级映射
4.关系数据库中各种关系术语:关系,元祖,属性,域,候选键,主键
关系(Relation):一个关系就是一张二维表,每一个关系有一个关系名,可以存储为一个文件。其定义可以描述为 的子集叫做域 , ,…, 上的关系,表示为 ,R表示关系的名称,n表示关系的目或度(Degree)。
元组:表中的行称为元组,一行就是一个元组,对应存储文件中的一个记录。
属性:关系中的一列称为一个属性。一个属性必须有唯一的属性名,一个关系可以有若干个属性值。
域(Domain):属性的取值范围,是一组具有相同数据类型的值的集合。
候选键:表中某一列(或若干列的最小组合)的值能惟一标识一个行,称该列或列组为候选键。如Students表的学号列,就是一个候选键。
对于一个表,可能有多个候选键 。
候选键取决于应用范围,如给定条件,没有重复的学生姓名,则姓名是学生基本情况表的一个候选键。
主键:如果一个表有多个候选键,数据库设计者通常选择其中一个候选键作为区分行的惟一性标识符,称为主键(primary key,PK)。如果一个表只有一个候选键,那么这个候选键就作为主键。例如,在学生基本情况表中,把学号作为该表的主键。
因为主键是候选键之一,而根据候选键的定义,候选键列上的各个值都惟一,因此主键列上的各个值也都惟一