分布式数据库系统的相关基本概念

分布式数据库系统原理

分布式数据库系统,简称为DDBS。它源自于两种数据处理方法的结合,一个是数据库系统DBS,另一个则是计算机网络。

很有意思的是数据库系统是将企业运营的数据集中起来,提供对数据可控制的存取。但是计算机网络技术提倡的是一种反对集中的工作模式。这两种对比如此鲜明的技术合在一起变成了分布式数据库技术,这种技术追求的是在可能取得集成的情况下放弃集中。

分布式

分布式处理(或者是分布式计算)没有准确的定义。

我们使用的分布式计算系统的定义要求它具备一定数量的自主式处理单元,这些单元通过计算机网络互连,并且协同处理它们各自分配到的任务。这里的处理单元是指能够执行自己程序的计算装置。

到底是什么需要分布,其中之一可以是处理逻辑。另一种可能的分布,是按照功能。第三种可能的分布则是根据数据,应用所使用的的数据可以分派到若干处理站点上。最后,控制也能够分布。不同任务的控制执行也可以分布,而不是由一个计算机系统完成。

为什么需要分布?分布式处理更好地和现如今分散企业的组织结构相对应。互联网的趋势大部分是在向分布式计算进行改变。

分布式处理背后的根本原因是,使用分治的思想应对今天所面临的大规模数据管理问题。如果能够开发出所需的支持分布处理的软件,就可以把复杂的问题分割成更小的部分,然后把它们分配到不同的软件群上解决。这些软件乓工作在不同的计算机上,形成一个系统,有效工作,共同完成任务。

分布式数据库系统

分布式的概念清晰之后,分布式数据库就比较好理解了。我们把一群分布在计算机网络上,逻辑上相互关联的数据库称之为分布式数据库。而分布式数据库系统就是支持管理分布式数据库的软件系统。

网络上会有一些集中式的数据库,它会把所有的数据库放在一个站点上。所有的请求全部都会路由到这个站点,这种不足以形成分布式数据库系统。

如下图所示

在这里插入图片描述

真正的DDBS环境应该是如下的
在这里插入图片描述

数据发送

在分布式数据库中,可以从发送方式、频率及通信方法三个维度来考虑。

其中,不同的发送方式包括:内拉,外推和混合。

内拉 服务器到客户端的数据传输是由客户端的请求发起的,客户端的请求到达后,服务端进行相应并查询相应的信息。它的特点是数据的变化是在服务器端的,客户从服务器接收的信息只会限于客户所请求的范围中

外推 这种方式是服务器在没有任何客户请求的情况下,让服务器发动。这种方式主要针对的是大家所共同关注的数据,以及什么时间进行发送。因此可选择周期性发送、不规则发送以及条件发送。

混合就是同时使用内拉与外推。在客户端发送查询请求后,此后相关的信息更新后服务端可以自主发送数据到客户端。

频率一般包含周期性,有条件或者凭经验(不规则)。

通信方法一般包含单播和一对多。单播很好理解,就是客户端与服务器端进行一对一的通信。一对多则是服务器向多个客户端发送数据。

DDBS的四个Promise(感觉翻译成保证更好一点,相当于优点)

  1. 分布及复制数据的透明管理

    透明的意思就是说对用户“隐藏”了所有系统实现的细节。用户只需要关心怎么用即可,不用在乎这个是怎么实现的。

    其中又包含了 数据独立性,网络透明,复制透明,分片透明,透明的提供者

  2. 分布式事务提供的可靠性

  3. 改进的性能

  4. 更加容易的系统拓展

分布式带来的复杂性

  1. 数据复制的问题
  2. 故障恢复的问题
  3. 事务同步的问题

这些都只是一些分布式的基本概念,而且我觉得都没有确切的概念。感觉还有很长的一段路等我去探索,前路漫漫…

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值