一些关于数据库知识的讨论1

1.简述数据库系统的特点

①数据结构化:数据库系统实现了整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的主要区别。这种结构化是指在数据库中的数据不再是仅仅针对某一应用,而是面向整个系统;数据库中,不仅数据内部是结构化的,而且整体也是结构化的,数据之间具有联系。

②数据的共享性高、冗余度低、易扩充:由于数据不再是面向某个特定应用,而是面向整个系统,所以数据可以被不同的用户和不同的应用共享,这样可以减少数据的冗余,节约存储空间,易于增加新的应用,使得数据库系统易于扩充。

③数据独立性高:数据独立性包括物理独立性和逻辑独立性,数据库系统通过二级映射实现这两种独立性。

④数据由数据库管理系统统一管理和控制:数据库提供了四个方面的数据控制功能,分别为,数据的安全性保护、数据的完整性检查、并发控制和数据库恢复。

2.数据、数据库、数据库管理系统概念

2.1. 数据(data)

    描述事物的符号记录称为数据。

    描述事物的符号可以是数字,也可以是文字、图形、图像、音频、视频等,数据有多种表现形式,他们都可以经过数字化后存入计算机。

    数据的表现形式还不能完全表达其内容,需要经过解释,数据和关于数据的解释是不可分的。

    数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。没有语义的数据在数据技术的世界中没有意义。

    记录是计算机中表示和存储数据的一种格式或一种方法。

2. 数据库(DB)

    数据库,顾名思义,是存放数据的仓库。只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的。

    人们收集并抽取出一个应用所需要的大量数据之后,应将其保存起来,以供进一步加工处理,抽取有用信息。

    在科学技术飞速发展的今天,人们的视野越来越广,数据量急剧增加。

    现在人们借助计算机和数据库技术科学地保存和管理大量复杂的数据。

    严格地讲,数据库长期存储在计算机内有组织的可共享的大量数据的集合

    数据库中的数据一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。

    概括地讲,数据库数据具有永久存储、有组织和可共享三个基本特点。

3. 数据库管理系统(DBMS)

    了解了数据和数据库的概念,下一个问题就是如何科学地组织和存储数据,如何高效地获取和维护数据。

          ——完成这个任务的是一个系统软件——数据库管理系统(如:SQL Server 2008)

    数据库管理系统是位于用户与操作系统之间的一层数据管理软件。

    数据库管理系统和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。

  它的功能包括以下几个方面:

    (1)数据定义功能  数据定义语言(DDL)

    (2)数据组织、存储和管理

          数据库管理系统要分类组织、存储和管理各种数据,包括数据字典、用户数据、数据的存取路径等。

          要确定以何种文件结构存取方式在存储级上组织这些数据,如何实现数据之间的联系

          数据组织和存储的基本目标是提高存储空间利用率和方便存取,

        提供多种存取方法(如索引查找、hash查找、顺序查找等)来提高存取效率。

    (3)数据操纵功能  数据操纵语言(DML)      查询、插入、删除和修改

    (4)数据库的事务管理和运行管理

          数据库在建立、运用和维护时 由 数据库管理系统 统一管理和控制,以保证事务的正确运行,

        保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。

    (5)数据库的建立和维护功能

           数据库的建立和维护功能包括:数据库初始数据的输入、转换功能,数据库的转储、恢复功能,数据库

        的重组织功能和性能监视、分析功能等。这些功能通常是由一些实用程序或管理工具完成的。

    (6)其他功能

          数据库管理系统与网络中其他软件系统的通信功能,

          一个数据库管理系统与另一个数据库管理系统或文件系统的数据转换功能,

          异构数据库之间的互访和互操作功能 等。

3.计算机数据管理的发展

数据库技术是应数据管理任务的需要而产生的。数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。数据管理则是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。

人们借助计算机进行数据处理是近三十年的事。研制计算机的初衷是利用它进行复杂的科学计算。随着计算机技术的发展,其应用远远地超出了这个范围。在应用需求的推动下,在计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统和分布式数据库系统四个阶段。 计算机数据管理的发展的四个阶段及各自的特点。

第一阶段:人工管理阶段( 50年代中期以前)

人工管理阶段 20世纪50年代以前,数据的组织和管理完全靠程序员手工完成。其硬件是:外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备;软件是:没有操作系统,没有管理数据的软件;数据处理方式是批处理。数据与应用程序之间的关系如图1-2所示。

    图 1-2 人工管理数据与程序的关系

特点:

(1)数据与程序不具有独立性

一组数据对应一组程序。这就使得程序依赖于数据,如果数据的类型、格式或者数据量、存取方法、输入输出方式等改变了,程序必须做相应的修改。

(2)数据不能长期保存

由于数据是面向应用程序的,在一个程序中定义的数据,无法被其他程序利用,因此程序与程序之间存在大量的重复数据。

(3)系统中没有对数据进行管理的软件

数据管理任务,包括存储结构、存储方法、输入输出方法等完全由计算机自负其责。这就给应用程序设计人员增加了很大的负担。

第二阶段:文件系统阶段( 50年代后期至60年代中后期)

文件系统阶段 20世纪50年代后期到60年代中期,这时硬件方面已有了磁盘、磁鼓等直接存取存储设备;软件方面,操作系统中已经有了专门的数据管理软件,一般称为文件系统;处理方式上不仅有了批处理,而且能够联机实时处理。由于文件系统具有数据的增、删、改等操作,使得数据管理变得轻松,且数据可以反复使用。但这个阶段仍存在一些问题,如数据冗余度大、数据共享性差等。

文件系统存在的问题:

(1)数据冗余和数据不一致(Data Redundancy and Inconsistency)

(2)数据访问困难 (Difficulty in Accessing Data)

(3)数据孤立 (Data Isolation)
(4)完整性问题 (Integrity Problems) 
(5)原子性问题 (Atomicity Problems) 
(6)并发性问题 (Concurrent-access Anomalies) 
(7)安全性问题 (Security Problems) 

图 1-3 文件系统数据与程序的关系

第三阶段:数据库系统阶段( 60年代后期至70年代后期)

数据库系统阶段 为了解决多用户、多应用共享数据的要求,使数据为尽可能多的应用服务,出现了统一管理数据的专门软件系统即数据库管理系统。
与人工管理和文件系统相比,数据库系统的特点主要有以下几个方面。 
(1)数据结构化
数据结构化是数据库与文件系统的根本区别。在文件系统中,相互独立的文件的记录内部是有结构的。传统文件的最简单形式是等长同格式的记录集合。
例 有3个文件,图书(总编号、分类号、书名、作者、出版单位、单价);读者(借书证号、姓名、性别、单位、职称、地址);借阅(借书证号、总编号、借阅日期、备注),要想查找某人所借图书的书名、出版社及借阅者的职称,则必须编写一段很不简单的程序来实现。数据库系统不仅表示属性之间的联系,而且表示实体之间的联系。只要定义好数据模型,上述询问可以非常容易地连机查到。
(2)数据的共享性高,冗余度低,易扩充
数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间。数据共享还能够避免数据之间的不相容性与不一致性。
所谓数据的不一致性是指同一数据不同拷贝的值不一样。采用人工管理或文件系统管理时,由于数据被重复存储,当不同的应用使用和修改不同的拷贝时就很容易造成数据的不一致。在数据库中数据共享,减少了由于数据冗余造成的不一致现象。
由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使得数据库系统弹性大,易于扩充,可以适应各种用户的要求。可以取整体数据的各种子集用于不同的应用系统,当应用需求改变或增加时,只要重新选取不同的子集或加上一部分数据便可以满足新的需求。
(3)数据独立性高
数据独立性是数据库领域中一个常用术语,包括数据的物理独立性和数据的逻辑独立性。
物理独立性是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不变。
数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由DBMS负责,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
(4)数据由DBMS统一管理和控制
数据库的共享是并发的(Concurrency)共享,即多个用户可以同时存取数据库中的数据甚至可以同时存取数据库中同一个数据。

图1-4 数据库系统数据与程序的关系


第四阶段:分布式数据库系统阶段(70年代后期之后)
分布式数据库系统是数据库技术和计算机网络技术相结合的产物,在80年代中期已有商品化产品问世。分布式数据库是一个逻辑上统一、地域上分布的数据集合,是计算机网络环境中各个节点局部数据库的逻辑集合,同时受分布式数据库管理系统的控制和管理。
其主要优点是:
(1)局部自主
网络上每个结点的数据库系统都具有独立处理本地事物的能力(大两的),而且各局部结点之间也能够互相访问、有效地配合处理更复杂的事物。因此,分布式数据库系统特别适合各个部门的地理位置分散的组织机构。例如,银行业务、飞机订票、企业管理等。
(2)可靠性和可用性
分布式系统比集中式系统有更高的可靠性,在个别结点或个别通信链路发生故障的情况下可以继续工作。一个局部系统发生故障不至于导致整个系统停顿或破坏,只要有一个结点上的数据备份可用的。可见,支持一定程度的数据冗余是充分发挥分布式数据库系统优点的先决条件之一。

(3)效率和灵活性 
分布式系统分散了工作负荷,缓解了单机容量的压力。数据可以存储在临近的常用结点,如果本结点的数据子集包含了要查询的全部内容,显然比集中式数据库在全集上查找节省时间。
系统易于实现扩展。例如,一个单位要增加新的机构,分布式数据库系统能够在对现有系统影响较小的情况下实现扩充。因此,扩大系统规模比集中式系统更加方便、经济、灵活。

图1-5 分布式数据库系统

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值