1. 高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。
在生产环境上很多时候是以Nginx
做反向代理对外提供服务,但是一天Nginx难免遇见故障,如:服务器宕机。当Nginx
宕机那么所有对外提供的接口都将导致无法访问。虽然我们无法保证服务器百分之百可用,但是也得想办法避免这种悲剧,我们使用keepalived
来实现Nginx
的高可用。
2. 双机热备方案:这种方案是国内企业中最为普遍的一种高可用方案,双机热备其实就是指一台服务器在提供服务,另一台为某服务的备用状态,当一台服务器不可用另外一台就会顶替上去。
3. Keepalived是什么?Keepalived
软件起初是专为LVS
负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议)功能。
故障转移机制
4. Keepalived
高可用服务之间的故障切换转移,是通过VRRP来实现的。
在 Keepalived
服务正常工作时,主 Master
节点会不断地向备节点发送(多播的方式)心跳消息,用以告诉备Backup
节点自己还活着,当主 Master
节点发生故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自主 Master
节点的心跳了,于是调用自身的接管程序,接管主Master节点的 IP资源及服务。
而当主 Master节点恢复时,备Backup节点又会释放主节点故障时自身接管的IP资源及服务,恢复到原来的备用角色。
实现过程:准备两台机器 192.168.16.1 192.168.16.2 两台虚拟机。安装好Nginx
5. 安装Nginx
1. 更新yum源文件
rpm -ivh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
2. 安装Nginx: yum -y install nginx
3. 操作命令:
systemctl start nginx; #启动Nginx
systemctl stop nginx; #停止Nginx
4. 安装keepalived,yum方式直接安装即可,该方式会自动安装依赖:
yum -y install keepalived
修改主机(192.168.16.1)keepalived配置文件
yum方式安装的会生产配置文件在/etc/keepalived下
vi keepalived.conf
keepalived.conf:
#检测脚本
vrrp_script chk_http_port {
script "/usr/local/src/check_nginx_pid.sh" #心跳执行的脚本,检测nginx是否启动
interval 2 #(检测脚本执行的间隔,单位是秒)
weight 2 #权重
}
#vrrp 实例定义部分
vrrp_instance VI_1 {
state MASTER # 指定keepalived的角色,MASTER为主,BACKUP为备
interface ens33 # 当前进行vrrp通讯的网络接口卡(当前centos的网卡) 用ifconfig查看你具体的网卡
virtual_router_id 66 # 虚拟路由编号,主从要一致
priority 100 # 优先级,数值越大,获取处理请求的优先级越高
advert_int 1 # 检查间隔,默认为1s(vrrp组播周期秒数)
#授权访问
authentication {
auth_type PASS #设置验证类型和密码,MASTER和BACKUP必须使用相同的密码才能正常通信
auth_pass 1111
}
track_script {
chk_http_port #(调用检测脚本)
}
virtual_ipaddress {
192.168.16.130 # 定义虚拟ip(VIP),可多设,每行一个
}
}
virtual_ipaddress
里面可以配置vip,在线上通过vip来访问服务。
interface
需要根据服务器网卡进行设置通常查看方式 ip addr
authentication
配置授权访问后备机也需要相同配置
修改备机(192.168.16.2)keepalived配置文件
keepalived.conf:
#检测脚本
vrrp_script chk_http_port {
script "/usr/local/src/check_nginx_pid.sh" #心跳执行的脚本,检测nginx是否启动
interval 2 #(检测脚本执行的间隔)
weight 2 #权重
}
#vrrp 实例定义部分
vrrp_instance VI_1 {
state BACKUP # 指定keepalived的角色,MASTER为主,BACKUP为备
interface ens33 # 当前进行vrrp通讯的网络接口卡(当前centos的网卡) 用ifconfig查看你具体的网卡
virtual_router_id 66 # 虚拟路由编号,主从要一致
priority 99 # 优先级,数值越大,获取处理请求的优先级越高
advert_int 1 # 检查间隔,默认为1s(vrrp组播周期秒数)
#授权访问
authentication {
auth_type PASS #设置验证类型和密码,MASTER和BACKUP必须使用相同的密码才能正常通信
auth_pass 1111
}
track_script {
chk_http_port #(调用检测脚本)
}
virtual_ipaddress {
192.168.16.130 # 定义虚拟ip(VIP),可多设,每行一个
}
}
检测脚本:
#!/bin/bash
#检测nginx是否启动了
A=`ps -C nginx --no-header |wc -l`
if [ $A -eq 0 ];then #如果nginx没有启动就启动nginx
systemctl start nginx #重启nginx
if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then #nginx重启失败,则停掉keepalived服务,进行VIP转移
killall keepalived
fi
fi
修改脚本权限: chmod 775 check_nginx_pid.sh
说明:脚本必须通过授权,不然没权限访问啊,在我们两台服务器执行、VIP(virtual_ipaddress:192.168.16.130)
,我们在生产环境是直接通过VIP来访问服务。
模拟nginx
故障:
修改两个服务器默认访问的Nginx
的html
页面作为区别。
首先访问192.168.16.130
,通过vip
进行访问,页面显示192.168.16.1
;说明当前是主服务器提供的服务。
这个时候192.168.16.1
主服务器执行命令:systemctl stop nginx; #停止nginx
再次访问vip(192.168.16.130)
发现这个时候页面显示的还是:192.168.16.1
,这是脚本里面自动重启。
现在直接将192.168.16.1
服务器关闭,在此访问vip(192.168.16.130)
现在发现页面显示192.168.16.2
,这个时候keepalived
就自动故障转移了,一套企业级生产环境的高可用方案就搭建好了。