分布式系统概论

一、分布式系统概念:

分布式系统是一种建立在网络之上的软件系统,它具有高度的内聚性和透明性。在分布式系统中,软件的各个组成部分分布在不同的计算机上,通过网络进行通信和协作,共同完成特定的任务。

分布式系统的一个重要特点是资源共享。

通过网络通信,分布式系统中的各个节点可以共享计算资源、存储资源和输入输出设备等。这使得分布式系统可以在处理大规模数据时,充分利用计算资源,提高系统的性能。

 

 

二、分布式系统目的:

分布式系统的目的是将复杂的任务分解为简单的子任务,并将这些子任务分配给不同的计算机进行处理,从而提高系统的性能、可靠性、可扩展性和容错性。

三、分布式系统的特性

内聚性、透明性、可扩展性、可靠性、一致性、高性能

1、内聚性

是指分布式系统中的各个节点在完成子任务的过程中,能够保持高度的自治。每个节点都具有本地数据库管理系统(DBMS),可以独立地处理数据和请求。

2、透明性

是指分布式系统对用户的应用来说是透明的,用户无法感知到系统中的数据分布、副本、数据存储位置以及事务的执行位置等信息。用户可以像使用本地系统一样使用分布式系统,而无需关心底层细节。

3、可扩展性


分布式系统的可扩展性指的是系统能够根据业务需求的变化和规模的扩大,有效地增加资源以满足更高的负载。可扩展性通常有两种模型:

  • 水平扩展:在现有的系统中增加新的机器节点,比如增加更多的服务器。
  • 垂直扩展:不增加新的机器节点,而是提升现有机器的性能,如增加内存、CPU等。
4、可靠性

可靠性指的是系统在面对错误和故障时能够继续运行的能力。在分布式系统中,每个服务都是独立运行的,一个服务的故障不会影响到其他服务的正常运行,从而提高了整个系统的可靠性。

5、一致性

一致性是指在分布式系统中,所有的数据副本在同一时刻是否具有相同的值。在实际应用中,由于网络延迟、分区以及并发操作等因素的影响,完全的一致性很难保证。因此,通常会根据实际业务的需求,选择适当的一致性模型,如强一致性、弱一致性、最终一致性等。

6、高性能

高性能是指系统能够快速响应用户的请求,提供高效的计算和服务。为了构建高性能的分布式系统,通常会采取以下策略:

  • 代码层面的优化:合理的编码和优化可以显著提高系统的响应速度和吞吐量。
  • 并发和多线程的使用:合理地使用并发和多线程能够更好地利用多核处理器和提高系统的并发能力。
  • 数据结构和算法的选择:选择合适的数据结构和算法可以有效地提高代码的执行效率。
  • 缓存的使用:合理地使用缓存能够提高系统的性能。

四、分布式系统类别

1、分布式数据存储

分布式数据存储系统通常包括以下几个关键组件:

  • 数据节点:负责存储数据,并响应数据读取和写入请求。
  • 元数据节点:负责存储关于数据存储位置的元数据,例如数据块的索引和映射信息。
  • 控制节点:负责协调和管理整个分布式数据存储系统,如处理节点加入、离开、故障等事件。

一些常见的分布式数据存储系统如下:

  • HDFS(Hadoop Distributed File System):Hadoop分布式文件系统,是一种分布式文件系统,用于存储大数据应用程序中的海量数据。
  • GlusterFS:一种开源的分布式文件系统,可用于存储大规模非结构化和半结构化数据。
  • Ceph:一种开源的分布式存储系统,可用于存储大规模结构化和非结构化数据。
  • Cassandra:一种分布式NoSQL数据库,可用于存储大量的稀疏数据。
  • HBase:一种分布式列式数据库,可用于存储大量的稀疏数据。

2、分布式计算

如MapReduce、Spark等,它们将计算任务分布在多个节点上,提高计算性能和效率。

 

3、分布式文件系统

常见的分布式文件系统如下:

  • HDFS(Hadoop Distributed File System):Hadoop分布式文件系统,是一种分布式文件系统,用于存储大数据应用程序中的海量数据。
  • GlusterFS:一种开源的分布式文件系统,可用于存储大规模非结构化和半结构化数据。
  • Ceph:一种开源的分布式存储系统,可用于存储大规模结构化和非结构化数据。
  • FastDFS:一种国产的分布式文件系统,专为大规模文件存储而设计,具有高性能、高可靠性等特点。 
4、分布式消息

分布式消息是指在分布式系统中,通过消息队列(Message Queue)在各个服务或组件之间进行数据传递的一种方式。在分布式消息传递过程中,生产者(Producer)将消息发送到消息队列,而消费者(Consumer)从消息队列中读取消息并进行相应的处理。

分布式消息传递机制具有以下几个主要特点:

  • 异步处理:生产者和消费者之间通过消息队列进行解耦,可以独立地处理各自的任务,从而提高系统的并发处理能力。
  • 削峰填谷:在系统面临高并发请求时,消息队列可以暂时存储大量请求,使得系统在处理请求时不会因为流量过大而崩溃。
  • 数据一致性和可靠性:通过消息队列的有序、不重复、不丢失的特性,可以确保数据的最终一致性。
  • 高可用性:分布式消息队列可以在多个节点上部署,即使部分节点出现故障,系统仍然可以正常运行。
  • 可扩展性:分布式消息队列可以根据业务需求动态地添加或减少节点,以满足更高的负载。

5、分布式应用

分布式应用(distributed application)是一种应用程序,它分布在通过网络相连的不同计算机上,共同完成一项任务。这种应用能够并发服务多个用户,充分利用处理器资源,这主要取决于其设计特征。典型的分布式应用包括双重式(客户机服务器)、三重式(客户机中间件服务器)和多重式(客户机多组件多服务器)。

在构建分布式应用时,主要涉及以下几种技术:

  • 客户机/服务器体系结构:这是一种典型的分布式应用架构,其中客户端(客户机)发送请求给服务器,服务器处理请求并返回响应。
  • 远程过程调用(RPC):它允许在一个计算机上的程序调用另一个计算机上的程序,就像它们是同一个程序的一部分一样。
  • 分布式计算环境(DCE):它是一种分布式计算框架,提供了一组工具和服务,以帮助开发人员构建分布式应用。
  • 分布式组件对象模型(DCOM):它是一种分布式对象技术,允许在不同计算机上的对象之间进行通信和协作。
  • 通用对象请求代理体系结构(COBRA):它是一种分布式对象技术,提供了一种标准的对象请求代理,以实现不同计算机上的对象之间的通信。
  • 企业 Intranet Applet:这是一种基于Java技术的分布式应用,运行在企业内部网络环境中。
  • Java 分布式对象模型:它是一种基于Java语言的分布式对象技术,提供了在不同Java虚拟机上运行的对象之间的通信和协作
 6、分布式分类账

分布式分类账(Distributed Ledger Technology,简称DLT)是一种创新性的技术,它通过在多个站点或参与方之间复制、共享和同步数字数据来实现去中心化的数据库。

这种技术不同于传统的中心化数据库,后者通常由一个中央管理员负责管理数据存储。分布式分类账提供了一个同步的数据库系统,可以提供可审计的历史信息记录,对网络中的每个成员都是可见的。分布式分类账依赖于与区块链相似的共识原则。

五、分布式系统面临的挑战

分布式系统面临的挑战包括数据一致性、容错性、负载均衡、网络延迟等。为了解决这些问题,分布式系统需要采用各种技术和策略,如数据副本、故障检测与恢复、任务调度等。总的来说,分布式系统是一种将任务和资源分布在多个计算机上,通过网络协作完成任务的软件系统。它具有高性能、高可靠性、高可扩展性和高容错性等优点,但同时也面临着诸多挑战。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

你好皮~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值