18.1 集群介绍
根据功能划分为两大类:高可用和负载均衡
高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务
实现高可用的开源软件有:heartbeat、keepalived
负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2
实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler
18.2 Keepalived介绍
在这里我们使用keepalived来实现高可用集群,因为heartbeat在centos6上有一些问题,影响实验效果
keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。
在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色。
master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。
Keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的。
18.3-18.5 用Keepalived配置高可用集群
准备两台机器130和132,130作为master,132作为backup
两台机器都执行yum install -y keepalived
两台机器都安装nginx,其中130上已经编译安装过nginx,132上需要yum安装nginx: yum install -y nginx
设定vip为100
编辑130上keepalived配置文件,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/master_keepalived.conf获取
130编辑监控脚本,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/master_check_ng.sh获取
给脚本755权限
systemctl start keepalived 130启动服务
132上编辑配置文件,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_keepalived.conf获取
132上编辑监控脚本,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_check_ng.sh获取
给脚本755权限
132上也启动服务 systemctl start keepalived
环境准备:
两台虚拟机:
系统:centos 7.3_64位
master:192.168.8.131;编译安装nginx;yum install -y keepalived
backup:192.168.8.130;yum install -y nginx;yum install -y keepalived
VIP:192.168.8.100
注: VIP(virtual IP)虚拟IP,由Keepalived设置,用于服务器对外提供服务。
安装keepalived
master
安装Keepalived:
[root@Dasoncheng ~]# yum install -y keepalived
查看nginx版本:
[root@Dasoncheng ~]# /usr/local/nginx/sbin/nginx -v
nginx version: nginx/1.12.1
backup
安装Keepalived:
[root@localhost ~]# yum install -y keepalived
安装nginx:
[root@localhost ~]# yum install -y nginx
查看nginx版本:
[root@localhost ~]# nginx -v
nginx version: nginx/1.10.2
master配置:
配置Keepalived:
在此使用自定义的Keepalived配置文件脚本(先清空或删除自带配置文件脚本)。
[root@Dasoncheng ~]# vim /etc/keepalived/keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
} #定义故障提醒邮件接收地址(本实验用不到)
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL #定义故障提醒邮件发送地址(本实验用不到)
}
vrrp_script chk_nginx { #定义监控脚本
script "/usr/local/sbin/check_ng.sh" #指定服务健康检测(check)脚本
interval 3 #检测时间间隔
}
vrrp_instance VI_1 {
state MASTER #定义该服务的角色
interface ens33 #定义在本机中监听VIP的网卡
virtual_router_id 51 #虚拟路由id(同组中的服务器保持该id一致)
priority 100 #指定本机权重(决定优先级)
advert_int 1
authentication { #定义认证相关信息
auth_type PASS #认证类型为密码形式
auth_pass 123456 #定义认证密码
}
virtual_ipaddress { #定义VIP
192.168.188.100
}
track_script { #加载监控服务(脚本)
chk_nginx #注意此处服务名称要与上面监控脚本名称一致
}
}
创建监控脚本:
[root@Dasoncheng ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived #在此停止Keepalived服务是为了避免发生脑裂
fi
fi
更改脚本权限:
[root@Dasoncheng ~]# chmod 755 /usr/local/sbin/check_ng.sh
启动Keepalived服务:
[root@Dasoncheng ~]# systemctl start keepalived
检测服务状态:
[root@Dasoncheng ~]# ps aux |grep keep
root 4586 0.0 0.1 111708 1308 ? Ss 15:44 0:00 /usr/sbin/keepalived -D
root 4587 0.1 0.2 111708 2556 ? S 15:44 0:00 /usr/sbin/keepalived -D
root 4588 0.6 0.1 111708 1620 ? S 15:44 0:00 /usr/sbin/keepalived -D
root 4682 0.0 0.0 112664 972 pts/1 S+ 15:45 0:00 grep --color=auto keep
[root@Dasoncheng ~]# ps aux |grep nginx
root 3380 0.0 0.1 45352 1164 ? Ss 14:15 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody 3381 0.0 0.4 47840 4064 ? S 14:15 0:00 nginx: worker process
nobody 3382 0.0 0.3 47840 3804 ? S 14:15 0:00 nginx: worker process
root 4696 0.0 0.0 112664 976 pts/1 R+ 15:45 0:00 grep --color=auto nginx
[root@Dasoncheng ~]# /etc/init.d/nginx stop
Stopping nginx (via systemctl): [ 确定 ]
[root@Dasoncheng ~]# ps aux |grep nginx
root 4814 0.0 0.1 45352 1184 ? Ss 15:46 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody 4816 0.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process
nobody 4817 5.0 0.3 47840 3820 ? S 15:46 0:00 nginx: worker process
root 4827 0.0 0.0 112664 976 pts/1 S+ 15:46 0:00 grep --color=auto nginx
注:由以上检测状态可知关闭nginx服务之后Keepalived会再次自动启动nginx服务
注释:“脑裂”,即当master宕机后仍然未释放VIP,同时backup接替master提供服务要使用同一VIP,因而导致两台机器争占同一VIP导致服务紊乱,所以当master宕机后需要关闭其Keepalived服务来避免脑裂现象发生。Keepalived服务的日志位置:/var/log/messages。
[root@Dasoncheng ~]# ip add //查看网卡信息,此处不能用ifconfig查看;因为ens33中增加了一个IP:192.168.8.100/32;
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff
inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33
valid_lft forever preferred_lft forever
inet 192.168.8.100/32 scope global ens33
valid_lft forever preferred_lft forever
backup配置:
配置Keepalived:同样使用自定义脚本。
[root@localhost ~]# vim /etc/keepalived/keepalived.conf
global_defs {
notification_email {
aming@aminglinux.com
}
notification_email_from root@aminglinux.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh"
interval 3
}
vrrp_instance VI_1 { #只有该部分与master有区别
state BACKUP #角色
interface ens33
virtual_router_id 51
priority 90 #权重,如果是多台服务器,权重决定了master宕机后,backup接管master角色的顺序。
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.8.100
}
track_script {
chk_nginx
}
}
创建监控脚本:
[root@localhost ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
更改脚本权限:
[root@localhost ~]# chmod 755 /usr/local/sbin/check_ng.sh
启动Keepalived服务:
[root@localhost ~]# systemctl start keepalived.service
说明: 该检测脚本中与master检测脚本的区别在于:systemctl start nginx,即nginx的启动方式,因为在backup服务器中是使用yum安装的nginx,默认添加到系统服务中。
测试:
master宕机前:
backup:
使用VIP访问: (此时默认访问到master服务器。)
master宕机后:
[root@Dasoncheng ~]# systemctl stop keepalived.service //关闭master的keepalived,模拟宕机情景;
[root@Dasoncheng ~]# ip add //查看master上IP状态;ens33上已经没有了VIP。
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff
inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33
valid_lft forever preferred_lft forever
inet6 fe80::65d2:adc:20d3:8c74/64 scope link
valid_lft forever preferred_lft forever
[root@localhost ~]# ip add //查看back上IP状态: VIP转移到backup的ens33网卡上。然后使用浏览器访问VIP。
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff
inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33
valid_lft forever preferred_lft forever
inet 192.168.8.100/32 scope global ens33
valid_lft forever preferred_lft forever
inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link
valid_lft forever preferred_lft forever
master宕机后由backup继续提供服务。
其中: 恢复master上的Keepalived服务后,会由master服务器为该集群提供服务;