分布式数据库

介绍
  • 集中式数据库系统的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。

  • 分布式数据库的数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。 是计算机网络环境中各场地上数据库的逻辑集合。包含两个重要组成部分:分布式数据库分布式数据库管理系统

  • 在分布式数据库系统DDBS(Distributed Database System)中,一个应用程序可以对数据库进行透明操作,数据库中的数据分别在不同的局部数据库中存储、由不同的 DBMS进行管理、在不同的机器上运行、由不同的操作系统支持、被不同的通信网络连接在一起。

  • 分类:

    ①同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型),并且是同一型号的DBMS。

    ②同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS的型号不同,譬如DB2、ORACLE、SYBASE、SQL Server等。

    ③异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。

  • DDBS的基本特点:

    ①物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。

    ②逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户(全局用户)共享,并由一个DDBMS统一管理。

    ③场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。

    ④场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体(全局应用)。

体系结构
分布式数据存储
  • 数据分配:是指数据在计算机网络各场地上的分配策略。有时也称为“数据分布”。一般存在着四种分配策略。

    (1)集中式:所有数据均安排在同一场地。
    (2)分割式:所有数据只有一份,分别被安置在若干场地。
    (3)全复制式:数据在每个场地重复存储。
    (4)混合式:介于分割式和全复制式之间的分配方式。

  • 数据分片:分布式数据库中的数据可被分割和复制在网络场地的各个物理数据库中。一般数据存放的单位不是关系而是片段,一个片段是关系的一部分。分片的方式主要有下面三种:

    (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
    (2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。
    (3)混合型分片

    在定义各种分片时必须遵守的条件:

    (1)完备性条件。不允许发生属于全局关系的某个数据不属于任何一个片段。
    (2)重构条件。必须确保能够由各个片段重建全局关系。 
    (3)不相交条件。要求一个全局关系被划分后所得的各个数据片段互相不重叠。

【参考文档】
史上最全分布式数据库概述
分布式数据库系统学习笔记

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值