分布式:一个任务分给多台机器去做,减少单个任务的执行时间。
集群:提高单位时间内执行任务数。
例如:一个任务由10个子任务组成,每个子任务单独执行需要1个小时,则在一台服务器上执行该任务需要10个小时。
分布式方案:提供10台服务器,每台服务器只处理一个子任务,不考虑任务间的依赖关系,执行完这个任务只需要一个小时。
集群方案:同样提供10台服务器,每台服务器都能独立处理这个任务。假设有10个任务同时到达,10个服务器将同时工作,10小时后,10个任务同时完成,同样是一个小时完成一个任务。
分布式与集群,通俗讲:分布式是以缩短单个任务的执行时间来提升效率的,而集群是通过提高单位时间内执行的任务数来提升效率的
分布式:
分布式属于工作方式,重点是任务可拆分,分布式强调任务的差异性,所以分布式 最主要的是一致性,比如一个任务在一个节点运行需要8个小时,将该任务分散到8台机器分布式跑,可能2个小时就跑完了
分布式的每一个节点都可以叫做集群,集群就不一定是分布式的
集群统一管理,一台服务器挂掉,其他服务器可以继续工作
分布式每个节点完成不同任务,一个节点挂掉,业务则无法继续进行
集 群:
集群属于物理形态,多个节点,组成集群,集群是物理集中、统一管理,强调任务的统一性,比如一个任务在一台机器上跑需要8小时,把任务放到集群上海市需要8小时,假如有10个任务,放在集群上,还是需要8小时
集群分类:
1:高可用集群( High Availability Cluster)
2:负载均衡集群(Load Balance Cluster)
3:科学计算集群(High Performance Computing Cluster)
集群概念:
1、两个关键特性
集群是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性和可用性的服务平台。
可扩展性:集群的性能不限于单一的服务实体,新的服务实体可以动态的加入到集群中
高可用性:同样的服务可以由多个服务实体提供,如果一个服务实体失败了,另一个服务实体会接管失败的服务实体。
2、两大能力:
为了具备高可扩展性和高可用性,要具备两大能力
负载均衡:把任务比较均衡的分配到集群环境下的节点
错误恢复:由于某种原因,执行某个任务的资源出现故障,另一服务实体中执行同一任务的资源接着完成任务。
3、两大技术
集群地址
内部通信
1:集群地址 --- 集群由多个服务实体组成,集群客户端通过访问集群的集群地址获取集群内部各服务实体的功能。具有单一集群地址(也叫单一影像)是集群的一个基 本特征。维护集群地址的设置被称为负载均衡器。负载均衡器内部负责管理各个服务实体的加入和退出,外部负责集群地址向内部服务实体地址的转换。有的负载均 衡器实现真正的负载均衡算法,有的只支持任务的转换。只实现任务转换的负载均衡器适用于支持ACTIVE-STANDBY的集群环境,在那里,集群中只有 一个服务实体工作,当正在工作的服务实体发生故障时,负载均衡器把后来的任务转向另外一个服务实体。
2:内部通信 --- 为了能协同工作、实现负载均衡和错误恢复,集群各实体间必须时常通信,比如负载均衡器对服务实体心跳测试信息、服务实体间任务执行上下文信息的通信。
分布式(集群)与集群的联系和区别
分布式是将不同的业务分布在不同的地方
集群是将几台服务器集中在一起,实现同一业务
分布式中每个节点,都可以做集群
而集群不一定是分布式的
参考文章:
https://baijiahao.baidu.com/s?id=1589076984231961791&wfr=spider&for=pc
https://blog.csdn.net/qq_18815817/article/details/78981225