数据库

数据库

锁定
数据库(Database)是按照 数据结构来组织、 存储和管理数据的仓库,它产生于距今六十多年前,随着 信息技术和市场的发展,特别是二十世纪九十年代以后, 数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种 类型,从最简单的存储有各种数据的 表格到能够进行海量 数据存储的大型 数据库系统都在各个方面得到了广泛的应用。
在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。
中文名
数据库
外文名
Database
产生时间
1950年
概    念
电子化文件柜
基本结构
分三个层次
主要特点
6个
数据种类
3种
发明人
雷明顿兰德公司

定义

定义1

数据库
数据库 (11张)
数据库(Database)是按照 数据结构来组织、 存储和管理数据的建立在计算机存储设备上的仓库。
简单来说是本身可视为 电子化文件柜——存储电子 文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。
经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。
例如, 企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、 姓名年龄性别籍贯工资简历等)存放在表中,这张表就可以看成是一个数据库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在 财务管理仓库管理、生产管理中也需要建立众多的这种"数据库",使其可以利用 计算机实现财务、仓库、生产的自动化管理。

定义2

严格来说,数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据指的是以一定的数据模型组织、描述和储存在一起、具有尽可能小的 冗余度、较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。
这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改、查由统一软件进行管理和控制。从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。 [1]   [2]  

处理系统

数据库是一个 单位或是一个应用领域的通用 数据处理系统,它存储的是属于企业和事业部门、 团体和个人的有关数据的 集合。数据库中的数据是从全局观点出发建立的,按一定的 数据模型进行组织、描述和存储。其结构基于数据间的自然联系,从而可提供一切必要的存取 路径,且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。
数据库中的数据是为众多用户所 共享其信息而建立的,已经摆脱了具体 程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。

基本结构

数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。
内模式框架所组成的数据库叫做物理数据库;以 概念模式为框架所组成的数据叫概念数据库;以 外模式为框架所组成的数据库叫用户数据库。
⑴ 物理 数据层
它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是 原始数据,是用户加工的对象,由内部模式描述的 指令操作处理的位串、字符和字组成。
⑵ 概念 数据层
它是数据库的中间一层,是数据库的整体 逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是 数据库管理员概念下的数据库。
⑶ 用户 数据层
它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即 逻辑记录的集合。
数据库不同层次之间的联系是通过 映射进行转换的。

主要特点

⑴ 实现数据共享
数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
⑵ 减少数据的冗余度
同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
⑶ 数据的独立性
数据的独立性包括逻辑独立性(数据库中数据库的 逻辑结构应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。
⑷ 数据实现集中控制
文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过 数据模型表示各种数据的组织以及数据间的联系。
数据一致性 和可维护性,以确保数据的安全性和可靠性
主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;② 完整性控制:保证数据的正确性、有效性和相容性;③ 并发控制:使在同一时间 周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用。
⑹ 故障恢复
数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。 数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误操作造成的数据错误等。

数据种类

数据库通常分为 层次式数据库网络式数据库关系式数据库三种。而不同的数据库是按不同的 数据结构来联系和组织的。
1.数据结构模型
数据结构
所谓 数据结构是指数据的组织形式或数据之间的联系。
如果用D表示数据,用R表示 数据对象之间存在的关系集合,则将DS=(D,R)称为 数据结构
例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的 数据结构就是DS=(D,R),即一个 数组
数据结构类型
数据结构又分为数据的 逻辑结构和数据的 物理结构
数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关;数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为 存储结构
这里只研究数据的逻辑结构,并将反映和实现数据联系的方法称为 数据模型
比较流行的 数据模型有三种,即按 图论理论建立的 层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。
2.层次、网状和关系数据库系统
层次结构 模型
层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的 连通图)。下图是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。
按照层次模型建立的 数据库系统称为层次模型数据库系统。 IMS(Information Management System)是其典型代表。
网状结构模型
按照网状 数据结构建立的 数据库系统称为网状数据库系统,其典型代表是 DBTG(Database Task Group)。用 数学方法可将网状 数据结构转化为层次数据结构。
⑶ 关系结构模型
关系式 数据结构把一些复杂的数据结构归结为简单的 二元关系(即 二维表格形式)。例如某单位的职工关系就是一个二元关系。
由关系 数据结构组成的 数据库系统被称为 关系数据库系统
关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。
dBASEⅡ就是这类 数据库管理系统的典型代表。对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。用dBASEⅡ建立起来的一个关系称为一个数据库(或称 数据库文件),而把对应多个关系建立起来的多个数据库称为 数据库系统。dBASEⅡ的另一个重要功能是通过建立 命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。
因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个 数据库系统数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。

发展简史

技术发展

使用 计算机后,随着数据处理量的增长,产生了 数据管理技术。数据管理技术的发展与计算机硬件(主要是外部存储器)系统软件及计算机应用的范围有着密切的联系。数据管理技术的发展经历了以下四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段。
数据管理的诞生
数据库的历史可以追溯到五十年前,那时的 数据管理非常简单。通过大量的分类、比较和表格绘制的机器运行数百万 穿孔卡片来进行数据的处理,其运行结果在纸上打印出来或者制成新的穿孔卡片。而 数据管理就是对所有这些穿孔卡片进行物理的储存和处理。然而,1950 年 雷明顿兰德公司(Remington Rand Inc)的一种叫做 Univac I 的计算机推出了一种一秒钟可以输入数百条记录的 磁带驱动器,从而引发了 数据管理的革命。1956 年 IBM生产出第一个 磁盘驱动器—— the Model 305 RAMAC。此 驱动器有50 个盘片,每个盘片直径是2 英尺,可以储存5MB的数据。使用 磁盘最大的好处是可以 随机存取数据,而穿孔卡片和磁带只能顺序存取数据。
1951: Univac系统使用磁带和穿孔卡片作为 数据存储
数据库系统的萌芽出现于二十世纪60 年代。当时计算机开始广泛地应用于 数据管理,对数据的共享提出了越来越高的要求。传统的文件系统已经不能满足人们的需要,能够统一管理和共享数据的 数据库管理系统DBMS)应运而生。 数据模型数据库系统的核心和基础,各种DBMS 软件都是基于某种数据模型的。所以通常也按照 数据模型的特点将 传统数据库系统分成 网状数据库层次数据库关系数据库三类。
最早出现的网状 DBMS,是 美国通用电气公司Bachman等人在1961年开发的IDS(Integrated Data Store)。1964年 通用电气公司(General ElectricCo.)的Charles Bachman 成功地开发出世界上第一个网状DBMS也即第一个 数据库管理系统—— 集成数据存储(Integrated Data Store IDS),奠定了 网状数据库的基础,并在当时得到了广泛的发行和应用。IDS 具有数据模式和 日志的特征,但它只能在GE主机上运行,并且数据库只有一个文件,数据库所有的表必须通过手工 编码生成。之后,通用电气公司一个 客户——BF Goodrich Chemical 公司最终不得不重写了整个系统,并将重写后的系统命名为集成数据管理系统(IDMS)。
网状 数据库模型对于层次和非层次结构的事物都能比较自然的模拟,在 关系数据库出现之前网状DBMS要比层次DBMS用得普遍。在数据库发展史上,网状数据库占有重要地位。
层次型DBMS是紧随网络型数据库而出现的,最著名最典型的 层次数据库系统是IBM 公司在1968 年开发的 IMS(Information Management System),一种适合其主机的 层次数据库。这是IBM公司研制的最早的大型 数据库系统 程序产品。从60年代末产生起,如今已经发展到IMSV6,提供群集、N路数据共享、 消息队列共享等先进特性的支持。这个具有30年历史的数据库产品在如今的WWW应用连接、商务智能应用中扮演着新的角色。
1973年Cullinane公司(也就是后来的Cullinet软件公司),开始出售Goodrich公司的IDMS改进版本,并且逐渐成为当时世界上最大的软件公司。

关系由来

网状数据库和层次数据库已经很好地解决了数据的 集中共享问题,但是在 数据独立性抽象级别上仍有很大欠缺。用户在对这两种数据库进行存取时,仍然需要明确数据的 存储结构,指出存取路径。而后来出现的 关系数据库较好地解决了这些问题。
1970年, IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了 关系模型的概念,奠定了关系 模型的理论基础。尽管之前在1968年Childs已经提出了面向集合的模型,然而这篇论文被普遍认为是 数据库系统历史上具有划时代意义的 里程碑。Codd的心愿是为数据库建立一个优美的 数据模型。后来Codd又陆续发表多篇文章,论述了 范式理论和衡量 关系系统的12条标准,用数学理论奠定了 关系数据库的基础。关系模型有严格的数学基础,抽象级别比较高,而且简单清晰,便于理解和使用。但是当时也有人认为关系模型是理想化的 数据模型,用来实现DBMS是不现实的,尤其担心 关系数据库的性能难以接受,更有人视其为当时正在进行中的网状数据库规范化工作的严重威胁。为了促进对问题的理解,1974年 ACM牵头组织了一次研讨会,会上开展了一场分别以Codd和Bachman为首的支持和反对 关系数据库两派之间的辩论。这次著名的辩论推动了 关系数据库的发展,使其最终成为现代数据库产品的主流。
1969年Edgar F.“Ted” Codd发明了 关系数据库
1970年关系模型建立之后, IBM公司在San Jose实验室增加了更多的研究人员研究这个项目,这个项目就是著名的System R。其目标是论证一个全功能关系DBMS的可行性。该项目结束于1979年,完成了第一个实现 SQL的 DBMS。然而IBM对IMS的承诺阻止了System R的投产,一直到1980年System R才作为一个产品正式推向市场。IBM产品化步伐缓慢的三个原因: IBM重视信誉,重视质量,尽量减少故障; IBM是个大公司,官僚体系庞大,IBM内部已经有 层次数据库产品,相关人员不积极,甚至反对。
然而同时,1973年 加州大学伯克利分校的Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的 关系数据库系统 Ingres。他们开发的Ingres项目最后由 Oracle公司、 Ingres公司以及硅谷的其他厂商所商品化。后来,System R和Ingres系统双双获得ACM的1988年“ 软件系统奖”。
1976年霍尼韦尔公司(Honeywell)开发了第一个商用 关系数据库系统——Multics Relational Data Store。 关系型数据库系统以 关系代数为坚实的理论基础,经过几十年的发展和实际应用,技术越来越成熟和完善。其代表产品有 Oracle、IBM公司的 DB2微软公司MS SQL Server以及 InformixADABAS D等等。

结构语言

1974年IBM的Ray Boyce和Don Chamberlin将Codd 关系数据库的12条准则的 数学定义以简单的关键字 语法表现出来,里程碑式地提出了 SQL(Structured Query Language)语言。 SQL语言的功能包括查询、操纵、定义和控制,是一个综合的、通用的 关系数据库语言,同时又是一种高度非过程化的语言,只要求用户指出做什么而不需要指出怎么做。SQL集成实现了 数据库生命周期中的全部操作。SQL提供了与 关系数据库进行交互的方法,它可以与标准的 编程语言一起工作。自产生之日起,SQL语言便成了检验 关系数据库的试金石,而SQL语言标准的每一次变更都指导着关系数据库产品的发展方向。然而,直到二十世纪七十年代中期,关系理论才通过SQL在商业数据库Oracle和DB2中使用。
1986年, ANSISQL作为关系数据库语言的 美国标准,同年公布了标准SQL文本。SQL标准有3个版本。基本SQL定义是ANSⅨ3135-89,“Database Language - SQL with Integrity Enhancement”[ANS89],一般叫做SQL-89。SQL-89定义了 模式定义、数据操作和 事务处理。SQL- 89和随后的ANSⅨ3168-1989,“Database Language-Embedded SQL”构成了第一代SQL标准。ANSⅨ3135-1992[ANS92]描述了一种增强功能的SQL,叫做SQL-92标准。SQL-92包括模式操作,动态创建和SQL语句动态执行、网络环境支持等增强特性。在完成SQL-92标准后,ANSI和ISO即开始合作开发SQL3标准。SQL3的主要特点在于 抽象数据类型的支持,为新一代对象 关系数据库提供了标准。
甲骨文公司 甲骨文公司
1976年IBM E.F.Codd发表了一篇里程碑的论文“R系统:数据库关系理论”,介绍了 关系数据库理论和查询语言SQL。Oracle的创始人 Ellison非常仔细地阅读了这篇文章,被其内容震惊,这是第一次有人用全面一致的方案管理数据信息。作者E.F.Codd 1966年就发表了 关系数据库理论,并在IBM研究机构开发原型,这个项目就是R系统,存取数据表的语言就是SQL。Ellison看完后,敏锐意识到在这个研究基础上可以开发商用 软件系统。而当时大多数人认为 关系数据库不会有商业价值。Ellison认为这是他们的机会:他们决定开发通用商用 数据库系统Oracle,这个名字来源于他们曾给 中央情报局做过的项目名。几个月后,他们就开发了Oracle 1.0。但这只不过是个玩具,除了完成简单关系查询不能做任何事情,他们花相当长的时间才使Oracle变得可用,维持公司运转主要靠承接一些 数据库管理项目和做顾问咨询工作。而IBM却没有计划开发,为什么蓝色巨人放弃了这个价值上百亿的产品,原因有很多:IBM的研究人员大多是学术出身,他们最感兴趣的是理论,而非推向市场的产品,从学术上看,研究成果应公开发表论文和演讲能使他们成名,为什么不呢?还有一个很主要的原因就是IBM当时有一个销售得还不错的 层次数据库产品 IMS。直到1985年IBM才发布了 关系数据库DB2 ,Ellision那时已经成了千万富翁。Ellison曾将IBM 选择Microsoft 的 MS-DOS作为IBM-PC机的 操作系统比为:“ 世界企业经营历史上最严重的错误,价值超过了上千亿美元。”IBM发表R系统论文,而且没有很快推出 关系数据库产品的错误可能仅仅次之。Oracle的市值在1996年就达到了280亿美元。 [3]  

对象数据

随着 信息技术和市场的发展,人们发现 关系型数据库系统虽然技术很成熟,但其 局限性也是显而易见的:它能很好地处理所谓的“表格型数据”,却对技术界出现的越来越多的复杂类型的数据无能为力。九十年代以后,技术界一直在研究和寻求新型 数据库系统。但在什么是新型 数据库系统的发展方向的问题上,产业界一度是相当困惑的。受当时技术风潮的影响,在相当一段时间内,人们把大量的精力花在研究“ 面向对象数据库系统(object oriented database)”或简称“OO数据库系统”。值得一提的是,美国Stonebraker教授提出的面向对象的 关系型数据库理论曾一度受到产业界的青睐。而Stonebraker本人也在当时被Informix花大价钱聘为技术总负责人。
然而,数年的发展表明, 面向对象关系型数据库系统产品的市场发展的 情况并不理想。理论上的完美性并没有带来市场的热烈反应。其不成功的主要原因在于,这种数据库产品的主要设计思想是企图用新型 数据库系统来取代现有的数据库系统。这对许多已经运用 数据库系统多年并积累了大量工作数据的客户,尤其是 大客户来说,是无法承受新旧数据间的转换而带来的巨大工作量及巨额开支的。另外, 面向对象关系型数据库系统使查询语言变得极其复杂,从而使得无论是数据库的开发 商家还是应用 客户都视其复杂的应用技术为畏途。

管理变革

二十世纪六十年代后期出现了一种新型 数据库软件:决策支持系统(DSS),其目的是让管理者在决策过程中更有效地利用数据信息。于是在1970年,第一个 联机分析处理工具——Express诞生了。其他 决策支持系统紧随其后,许多是由公司的IT部门开发出来的。
1985年,第一个商务智能系统(business intelligence)由Metaphor 计算机系统有限公司为Procter & Gamble公司开发出来,主要是用来连接销售信息和零售的 扫描仪数据。同年, Pilot 软件公司开始出售第一个商用客户/服务器执行 信息系统——Command Center。同样在这年,加州大学伯克利分校Ingres项目演变成Postgres,其目标是开发出一个 面向对象的数据库。此后一年, Graphael公司开发了第一个商用的对象 数据库系统—Gbase。
1988年,IBM公司的研究者Barry Devlin和Paul Murphy发明了一个新的术语—信息仓库,之后,IT的厂商开始构建实验性的 数据仓库。1991年,W.H. "Bill" Inmon出版了一本“如何构建数据仓库”的书,使得数据仓库真正开始应用。
1991: W.H.“Bill” Inmon发表了”构建数据仓库”
二十世纪九十年代,随着基于PC的客户/服务器计算模式和企业 软件包的广泛采用, 数据管理的变革基本完成。 数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。 Internet的异军突起以及 XML语言的出现,给 数据库系统的发展开辟了一片新的天地。

发展阶段

数据库发展阶段大致划分为如下的几个阶段:人工管理阶段、文件系统阶段、 数据库系统阶段、 高级数据库阶段。

人工管理阶段

20世纪50年代中期之前,计算机的软 硬件均不完善。硬件存储设备只有 磁带、卡片和纸带, 软件方面还没有 操作系统,当时的计算机主要用于 科学计算。这个阶段由于还没有 软件系统对数据进行管理, 程序员在程序中不仅要规定数据的 逻辑结构,还要设计其 物理结构,包括存储结构、 存取方法、输入输出方式等。当数据的物理组织或存储设备改变时, 用户程序就必须重新编制。由于数据的组织面向应用,不同的计算 程序之间不能共享数据,使得不同的应用之间存在大量的重复数据,很难维护 应用程序之间数据的一致性。
这一阶段的主要特征可归纳为如下几点:
(1)计算机中没有支持 数据管理软件,计算机系统不提供对用户数据的管理功能,应用程序只包含自己要用到的全部数据。用户编制程序,必须全面考虑好相关的数据,包括数据的定义、存储结构以即存取方法等。程序和数据是一个不可分割的整体。数据脱离了程序极具无任何存在的价值,数据无独立性。
(2)数据不能共享。不同的程序均有各自的数据,这些数据对不同的程序通常是不相同的,不可共享;即使不同的程序使用了相同的一组数据,这些数据也不能共享,程序中仍然需要各自加入这组数据,哪个部分都不能省略。基于这种数据的不可共享性,必然导致程序与程序之间存在大量的重复数据,浪费存储空间。
(3)不能单独保存数据。在 程序中要规定数据的逻辑结构和物理结构,数据与程序不独立。基于数据与程序是一个整体,数据只为本程序所使用,数据只有与相应的程序一起保存才有价值,否则毫无用处。所以,所有程序的数据不单独保存。 数据处理的方式是 批处理

文件系统阶段

这一阶段的主要标志是计算机中有了专门管理数据库的 软件—— 操作系统文件管理)。
上世纪50年代中期到60年代中期,由于计算机大容量直接存储设备如 硬盘、磁鼓的出现,
推动了 软件技术的发展,软件的领域出现了操作系统和高级软件,操作系统中的文件系统是专门管理外存的数据管理软件,操作系统为用户使用文件提供了友好 界面。操作系统的出现标志着 数据管理步入一个新的阶段。在文件系统阶段,数据以文件为单位存储在外存,且由操作系统统一管理,文件是操作系统管理的重要资源。
文件系统阶段的数据管理具有一下几个特点:
优点
(1)数据以“文件”形式可长期保存在外部存储器的磁盘上。由于计算机的应用转向信息管理,因此对文件要进行大量的查询、修改和插入等操作。
(2)数据的逻辑结构与物理结构有了区别, 程序和数据分离,使数据与程序有了一定的独立性,但比较简单。数据的逻辑结构是指呈现在用户面前的数据结构形式。数据的物理结构是指数据在计算机存储设备上的实际存储结构。程度与数据之间具有“设备独立性”,即程序只需用文件名就可与数据打交道,不必关心数据的物理位置。由操作系统的文件系统提供存取方法(读/写)。
(3)文件组织已多样化。有索引文件、链接文件和直接存取文件等。但文件之间相互独立、缺乏联系。数据之间的联系需要通过程序去构造。
(4)数据不再属于某个特定的程序,可以重复使用,即数据面向应用。但是文件结构的设计仍是基于特定的用途,程序基于特定的物理结构和存取方法,因此程度与数据结构之间的依赖关系并未根本改变。
(5)用户的 程序与数据可分别存放在 外存储器上,各个 应用程序可以共享一组数据,实现了以文件为单位的数据共享文件系统。
(6)对数据的操作以记录为单位。这是由于文件中只存储数据,不存储文件记录的结构描述信息。文件的建立、存取、查询、插入、删除、修改等操作,都要用程序来实现。
(7)数据处理方式有批处理,也有联机实时处理。
缺点
文件系统对计算机数据管理能力的提高虽然起了很大的作用,但随着数据管理规模的扩大,数据量急剧增加,文价系统显露出一些缺陷,问题表现在:
(1)数据文件是为了满足特定业务领域某一部门的专门需要而设计,数据和程序相互依赖,数据缺乏足够的独立性。
(2)数据没有集中管理的机制,其安全性和完整性无法保障,数据维护业务仍然由应用程序来承担;
(3)数据的组织仍然是面向 程序,数据与程序的依赖性强,数据的逻辑结构不能方便地修改和扩充,数据逻辑结构的每一点微小改变都会影响到 应用程序;而且文件之间的缺乏联系,因而它们不能反映 现实世界中事物之间的联系,加上操作系统不负责维护文件之间的联系,信息造成每个应用程序都有相对应的文件。如果文件之间有内容上的联系,那也只能由 应用程序去处理,有可能同样的数据在多个文件中重复储存。这两者造成了大量的 数据冗余
(4)对现有数据文件不易扩充,不易移植,难以通过增、删数据项来适应新的应用要求。

数据库系统阶段

20世纪60年代后期,随着计算机在 数据管理领域的普遍应用,人们对 数据管理技术提出了更高的要求:希望面向企业或部门,以数据为中心组织数据,减少数据的冗余,提供更高的数据共享能力,同时要求 程序和数据具有较高的独立性,当数据的逻辑结构改变时,不涉及数据的物理结构,也不影响 应用程序,以降低应用程序研制与维护的费用。数据库技术正是在这样一个应用 需求的基础上发展起来的。
概括起来,数据库系统阶段的数据管理具有以下几个特点:
(1)采用数据模型表示复杂的数据结构。数据模型不仅描述数据本身的特征,还要描述数据之间的联系,这种联系通过所有存取路径。通过所有存储路径表示自然的数据联系是数据库与传统文件的根本区别。这样,数据不再面向特定的某个或多个应用,而是面对整个应用系统。如面向企业或部门,以数据为中心组织数据,形成综合性的数据库,为各应用共享。
(2)由于面对整个应用系统使得,数据冗余小,易修改、易扩充,实现了数据贡献。不同的 应用程序根据处理要求,从数据库中获取需要的数据,这样就减少了数据的重复存储,也便于增加新的 数据结构,便于维护数据的一致性。
(3)对数据进行统一管理和控制,提供了数据的 安全性、完整性、以及 并发控制
(4) 程序和数据有较高的独立性。数据的逻辑结构与物理结构之间的差别可以很大,用户以简单的逻辑结构操作数据而无须考虑数据的物理结构。
(5)具有良好的用户 接口,用户可方便地开发和使用数据库。
从文件系统发展到 数据库系统,这在信息领域中具有里程碑的意义。在文件系统阶段,人们在 信息处理中关注的中心问题是系统功能的设计,因此 程序设计占主导地位;而在数据库方式下,数据开始占据了中心位置,数据的结构设计成为信息系统首先关心的问题,而 应用程序则以既定的数据结构为基础进行设计。大事记
[1]  

发展趋势

随着 信息管理内容的不断扩展,出现了丰富多样的 数据模型层次模型网状模型,关系模型, 面向对象模型,半结构化模型等),新技术也层出不穷( 数据流,Web 数据管理数据挖掘等)。每隔几年,国际上一些资深的数据库专家就会聚集一堂,探讨数据库研究现状,存在的问题和未来需要关注的新技术焦点。过去已有的几个类似 报告包括:1989年Future Directions inDBMS Research-The Laguna BeachParticipants ;1990年DatabaseSystems : Achievements and Opportunities ;1991年W.H. Inmon 发表的《构建数据仓库》;1995年Database。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值