分布式是指将多台服务器集中在一起,每台服务器都实现总体中的不同业务,做不同的事情。
所谓集群是指一组独立的计算机系统构成的一多处理器系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作(服务),可以是并行的,也可以是做备份。
大数据体系中分布式的调度主要有2类架构模式:
•去中心化模式
•中心化模式
去中心化模式,没有明确的中心,众多服务器之间基于特定规则进行同步协调。分布式和集群别?
集群分布式:
分布式的主要工作是分解任务,将职能拆解,多个人在一起做不同的事
集群:
集群主要是将同一个业务,部署在多个服务器上,多个人在一起做同样的事
Hadoop是Apache软件基金会下的顶级开源项目,用以提供:
•分布式数据存储
•分布式数据计算
•分布式资源调度
为一体的整体解决方案。