1,集群介绍。
根据功能划分为两类:高可用和负载均衡。
高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务。
实现高可用的开源软件有heartbeat、keepalived
负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,至少需要两台服务器。
实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler。
2,keepalived介绍。
keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。
在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色.
master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的master。
keppalived要有三个模板,分别是core、check、vrrp。其中core模板为keepalived的核心,负责主进程的启动,维护以及全局配置文件的加载和解析,check模板负责健康检查,vrrp模板是来实现VRRP协议的。
3,用keepalived配置高可用集群。
准备两台机器A和B,A做master,B做backup。
两台机器都需要安装keepalived和nginx。yum install -y keepalived。
编辑A上的keepalived配置文件和监控脚本。
给脚本755权限。
A上启动服务。systemctl start keepalived
B机器上使用yum install -y nginx来安装nginx,可以使用命令rpm -qa |grep nginx查看是否有安装过nginx。
编辑B上的keepalived配置文件和监控脚本。给脚本755权限。B上启动服务。
两台机器上查看是否开启防火墙,如果开启则需要停用。
脑裂:主认为从宕机,从认为主宕机就会出现脑裂。 如果两台机器直接网络异常,比如网卡通信有问题,或者配置了iptables策略,就会出现脑裂.
4,测试高可用。
先确定两台机器上nginx的差异,比如可以通过curl -I来查看nginx版本。
测试1:关闭master上的nginx服务
测试2:在master上增加iptables规则,iptables -I OUTPUT -p vrrp -j DROP
测试3:关闭master上的keepalived服务。
测试4:启动master上的keepalived服务。
附:
1,主上配置文件master_keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
}
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
interval 3
}
vrrp_instance VI_1 {
state MASTER
interface ens33
virtual_router_id 51
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass aminglinux>com
}
virtual_ipaddress {
192.168.188.100
}
track_script {
chk_nginx
}
}
2,主上监控脚本,master_check_ng.sh#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
3,从上配置文件backup_keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
}
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
interval 3
}
vrrp_instance VI_1 {
state BACKUP
interface ens33
virtual_router_id 51
priority 90
advert_int 1
authentication {
auth_type PASS
auth_pass aminglinux>com
}
virtual_ipaddress {
192.168.188.100
}
track_script {
chk_nginx
}
}
4,从上监控脚本backup_check_ng.sh
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi