高可用集群(HA)的搭建【翻译】

转载 2004年08月21日 10:19:00
?

高可用集群的搭建

解决方案一:The mon+heartbeat+fake+coda solution

mon:一个通用的资源监控系统, 它能监控网络服务的可用性和服务节点。

heartbeat:通过“串行线”或者“UDP”,提供两个节点之间的心跳检测。

fake:通过ARP欺骗(spoofing),实现IP层的主机“接管”。

??? 服务器的故障恢复(failover)是这样处理的:“mon”后台程序在负载均衡器上运行,它负责监控集群中的“服务进程”和“服务节点”。fping.monitor每个t秒会主动检测“服务节点”是否还活着(alive);其他相关的服务监控器每隔m秒主动检测各个节点上的服务进程。比如:http.monitor能检测http服务;ftp.monitor则用来检测ftp服务;等等。当检测到“服务节点”或者“服务进程”死掉或者复活时,警报会自动的在Linux vertual server table中删除或者添加一条规则。因此,负载均衡器会自动的屏蔽掉“服务进程”或者“服务节点”的失效,并且,当它们恢复可用时,又能自动恢复提供服务。

??? 现在,负载均衡器成了一个整个系统的单一失效点,为了屏蔽掉负载均衡器(主负载均衡器)的失效,我们需要设置一个备份的负载均衡器。“fake”软件可以用在这个备份机器(从负载均衡器)上,当主负载均衡器失效时,从负载均衡器可以接管主负载均衡器的IP地址,从而对外提供服务。“heartbeat”用来检测主负载均衡器的状态,从而决定是否启用从负载均衡器上的“fake”。

??? 但是,无论是主从服务器之间的“故障恢复”或者“服务接管”,都将会引起当前已经建立好的连接的失效,这需要客户端重新发送它们的请求。?

??? 网络文件系统Coda是一个容错的分布式文件系统,它是Andrew 文件系统的后继者。引入网络文件系统,主要是为了解决集群中遇到的存储一致性。

解决方案二:The ldirectord + heartbeat solution

??? ldirectord(Linux Director Daemon)是一个单独的进程,用来监控真实服务器的服务,目前,只支持两种服务:http和https。它只需要和heartbeat一起工作。

??? ldirectord相比mon的优势有:
??? 1) 它是专门为LVS写的
??????? 它读取配置文件/etc/ha.d/xxx.cf,该文件中包含了所有的IPVS 路由表配置。当ldirectord启动时,IPVS路由表就会正确的配置。

??? 2) 它可以方便被heartbeat启动/停止。

Hadoop HA高可用集群搭建(2.7.2)

1.集群规划: 2.前期准备: 3.搭建zookeeper集群(drguo3/drguo4/drguo5)
  • Dr_Guo
  • Dr_Guo
  • 2016年03月24日 22:33
  • 12106

HBase HA高可用集群搭建及HBase Shell简单使用

1.先搭建Hadoop HA集群(包含ZooKeeper搭建),请看这:Hadoop HA高可用集群搭建(2.7.2) 2.我只有五台机器,所以是这么规划的:drguo1/2 HMaster dr...
  • Dr_Guo
  • Dr_Guo
  • 2016年03月27日 17:28
  • 4249

spark集群与spark HA高可用快速部署 spark研习第一季

1、spark 部署 标签: spark 0 apache spark项目架构 spark SQL -- spark streaming -- MLlib -- GraphX ...
  • refuil
  • refuil
  • 2016年07月22日 09:15
  • 3435

hadoop2.7.3 HA高可用集群安装

hadoop2.7.3 HA高可用集群安装 HDFS高可用性(NameNode) NN必须实现共享元数据才能保证无缝切换;共享元数据可以采用Linux提供的NFS服务,也可以使用Ha...
  • ProfoundOx
  • ProfoundOx
  • 2016年12月20日 22:16
  • 1457

Redis Cluster高可用(HA)集群环境搭建详细步骤

1.为什么要有集群由于Redis主从复制架构每个数据库都要保存整个集群中的所有数据,容易形成木桶效应,所以Redis3.0之后的版本添加特性就是集群(Cluster)2.Redis集群架构说明 架构...
  • RobertoHuang
  • RobertoHuang
  • 2017年04月26日 22:17
  • 2931

集群(cluster)和高可用性(HA)的概念

摘自:http://blog.ixpub.net/12677297
  • zhu1289303556
  • zhu1289303556
  • 2016年01月09日 10:14
  • 3665

hadoop 集群HA高可用搭建以及问题解决方案

hadoop 集群HA高可用搭建目录大纲1. hadoop HA原理 2. hadoop HA特点 3. Zookeeper 配置 4. 安装Hadoop集群 5. Hadoop HA配置 搭建环境 ...
  • qq_26840065
  • qq_26840065
  • 2017年02月20日 19:44
  • 5257

Flink的高可用集群环境

JobManager高可用(HA)JobManager协调每一个Flink集群环境,它负责作业调度和资源管理。默认情况下,一个Flink集群中只有一个JobManager实例,这很容易造成单点故障(S...
  • jiangshouzhuang
  • jiangshouzhuang
  • 2016年09月23日 17:34
  • 3084

rabbitmq在高可用HA方面的方案总结

为了提高消息传递交付的可用性,rabbitMQ有几种集群的方案,不同的方案有不同的优缺点 1、普通的集群 rabbitMQ中的exchange和queue都包含meta、contents、state等...
  • yangbutao
  • yangbutao
  • 2013年09月03日 14:39
  • 17762

Spark集群搭建+基于zookeeper的高可用HA

1. Spark高可用HA 1.1安装zookeeper 1.1.1下载zookeeper-3.4.6 1.1.2 解压zookeeper 1.1.3 修改ZOOKEEPER_HOME/PAT...
  • lishuan182
  • lishuan182
  • 2016年08月26日 19:58
  • 4607
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:高可用集群(HA)的搭建【翻译】
举报原因:
原因补充:

(最多只允许输入30个字)