分布式系统原理

最新推荐文章于 2020-10-19 23:57:51 发布

少年的小俊

最新推荐文章于 2020-10-19 23:57:51 发布

阅读量1.3k

点赞数 1

分类专栏：大数据文章标签：算法

本文链接：https://blog.csdn.net/weixin_42290927/article/details/105861455

版权

10 篇文章 0 订阅

订阅专栏

初入分布式系统

分布式系统出现的原因，目前主要有两个
- 解决性能问题，解决单台计算机的并发能力，计算能力
- 解决故障问题，解决单台计算机发生故障(断电，服务中断，电脑宕机)时，保证整个系统仍能够运行
相较于分布式系统，在20世纪还流行过集中式系统，集中式系统，就是所有的资源都处在同一台计算机中，集中式系统为应对服务，需要的硬件资源很多(就是很贵)，这样做好处是不需要对不同子系统进行协调控制，保证程序运行的稳定性，但坏处是，当故障发生时，该软件服务就变为不可用
分布式系统(distributed system)，我的理解是分布开来的软件系统，分布式系统首先是一个软件系统，一个完全依赖软件和通用计算机组成的服务，
就是不被物理资源所限制，通过增加计算机数量和软件协同完成一个服务
分布式系统的特点除了依赖的计算机多以外，还表现为一个服务，通常对外的接口，或者说服务对接的入口，仅有一个，通过内部协同多台计算机，不需要对接不同的服务器，软件内部自己完成负载均衡，故障处理与恢复，协调不同子系统之间的状态等
分布式系统另一大优势在于，即使计算能力仍然不满足现有需求，通过一些简单的操作，继续为分布式系统添加计算机，就可以满足日益增长的需求，称为可拓展性

分布式系统是非常复杂的，首先分布式系统非常依赖网络，而网络故障、延时等问题就导致整个系统建在一个不稳定的地基上，其次，一个关键问题，如何保证不同的计算机之间的数据（状态）都是一样的(一致性)，然后各个计算机之间的关系是怎样的，不同计算机担当的角色一样吗，当性能不够的时候，如何保证新增的计算机能够被整个系统所使用
分布式系统对于故障处理的要求较高(高可用)，也就是当系统中的一些计算机无法正常提供服务时，如何保证整个系统仍然能够正常运行

维护整个系统的数据、状态保持一致?
- 使用分布式锁，即通过网络实现的锁，协调不同计算机并发带来的问题
保证系统高可用?
- 单机的数据进行复制备份，保证数据丢失情况下，仍能够保证运行
- 定期检测其他机器的状态，当故障发生时，及时处理
如何协调不同计算机进行工作？
- 最简单的方法就是让一台计算机称为大哥计算机，所谓大哥计算机(主计算机)，负责收集和管理小弟们的信息，分发任务和接收请求
- 可以手动指定一台计算机作为主，其他作为从属计算机
- 也可以通过算法，自动计算生成主计算机

这些理论和算法，对一些方案进行深入研究，并给出具体实施步骤，关键在复杂情况发生下时，仍能够保证算法的可行

关注