【集群】
Cluster,在百度翻译中的名词意思解释为:群,簇。
在我们计算机的磁盘中,每个磁盘都是由一个个扇区组成的,而若干个扇区合为一个簇。而我们所说的集群,它是指一种技术,它可以将多个系统连接到一起,使多台服务器能够像一台服务器那样工作或者是看起来好像一台机器。采用集群技术通常是为了提高系统的稳定性和网络 中心的数据处理能力以及服务能力。
随着大数据的发展,各大网站的负载也越来越高,在这种情况下,我们就要提高服务器的承受能力。有两种方法可以解决:一是升级服务器,包括CPU,内存等;二是增加服务器。而增加服务器所说的就是服务器集群。
【服务器集群特点】
1、高可管理性
一组相互独立服务器,对外是一个系统,是以单一系统模式管理。
2、共享
多台服务器可以共享数据存储空间。
3、高可用性
服务器之间可以互相通信,它有一个监听的机制,如果一台服务器发生故障,由另一台服务器自动接管。容错能力高,一旦一台服务器发生故障,系统可以与这台服务器进行隔离。
4、高扩展性
集群的性能不限于单一的服务实体,新的服务实体可以动态的加入到集群,从而增强集群的性能。
【两种实现方法】
1、将备份服务器连接到主服务器上,一旦主服务器发生故障,备份服务器开始运行。
2、由多台服务器组成的集群服务器,他们对外有一个统一的地址,每台集群服务器上都装有相同的应用程序,由一个负载均衡器来分配在哪台服务器上进行操作。各个集群服务器之间是相互通信的,一旦发生故障,可以自动转移到其他服务器。
负载均衡,英文名称为Load Balance,其意思就是分摊到多个操作单元上进行执行,例如Web
服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。
负载均衡器:是一种把网络请求分散到一个服务器集群中的可用服务器上去,通过管理进入的Web数据流量和增加有效的网络带宽的硬件设备。
【集群的缺点】
集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。整个应用的接管过程大体需要三个步骤:侦测并确认故障、后备服务器重新启动该应用、接管共享的数据区。因此在切换的过程中需要花费一定的时间,原则上根据应用的大小不同切换的时间也会不同,越大的应用切换的时间越长。
【分布式】
最早接触分布式的时候,是操作系统中的分布式系统。在一个分布式系统中,一组独立的计算机展现给用户的是一个系统,但是系统内部可以动态的分配任务。分散的物理和逻辑资源通过计算机网络实现信息的交换。万维网就是著名的分布式系统。
其实,分布式它相当于一种工作方式,例如计算1+2+……+100值。我们可以使用一台服务器进行计算,也可以使用2台服务器合作计算,例如服务器1执行1到50的相加计算,服务器2执行51到100的相加计算,然后再进行汇总。
【分布式特点】
1、计算速度加快
就拿刚才的例子来说,一台服务器计算100个数的话需要用10个小时。如果分为两台计算机,每台计算50个数,用的时间总共是5个小时,大大提高了计算的速度。
2、数据设备共享
允许多个用户访问同一个数据库和同样的外围设备。
3、灵活性
可以用最有效的方式将工作任务分配到可以使用的服务器上。
【分布式缺点】
如果执行任务期间,有一台服务器出现故障,虽然系统还可以继续运行,但这个任务就执行不完整。
【分布式与集群对比】
1、区别
(1)原理上
集群中每台服务器,可以执行的任务是一样的,相同的时间内,我们可以通过增加服务器来增加访问的人数。也就是说集群是将几台服务器集合到一起,来实现同一业务。
分布式,是按照一定的算法将任务分配给多台服务器,提高的是执行任务的时间。也就是说分布式是将不同的业务分不到不同的地方。
(2)容错能力上
集群服务器中如果有故障的服务器,可以自动隔离,问题解决后,可以自动恢复。而分布式服务器,一旦出现问题,任务就无法正常执行完成。
2、联系
分布式的每一个节点都可以做集群而集群并不一定是分布式的。
【总结】
结合分布式和集群的优点,我们就可以实现,按照一定的算法,来分配任务,如果有一台服务器出问题了,我们还可以根据一定的算法转移到另一台服务器上。比如说,有100个人参加考试,我们有3台服务器,每台服务器上都有考试的试卷,我们可以按照3:3:4的比例进行抽取试卷。一旦某台服务器出问题了,我们就可以根据另一套算法来进行试卷读取的服务器分配。 所以,具有分布式和集群优点的分布式集群就出现了。