18.1 集群介绍

最新推荐文章于 2024-10-03 08:44:33 发布

weixin_34112030

最新推荐文章于 2024-10-03 08:44:33 发布

阅读量49

点赞数

文章标签：运维开发工具 python

原文链接：https://my.oschina.net/u/3651233/blog/1529043

版权

2019独角兽企业重金招聘Python工程师标准>>>

18.1 集群介绍

根据功能划分为两大类：高可用和负载均衡
高可用集群通常为两台服务器，一台工作，另外一台作为冗余，当提供服务的机器宕机，冗余将接替继续提供服务
实现高可用的开源软件有：heartbeat、keepalived
负载均衡集群，需要有一台服务器作为分发器，它负责把用户的请求分发给后端的服务器处理，在这个集群里，除了分发器外，就是给用户提供服务的服务器了，这些服务器数量至少为2
实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx，商业的有F5、Netscaler

18.2 Keepalived介绍

在这里我们使用keepalived来实现高可用集群，因为heartbeat在centos6上有一些问题，影响实验效果
keepalived通过VRRP（Virtual Router Redundancy Protocl）来实现高可用。
在这个协议里会将多台功能相同的路由器组成一个小组，这个小组里会有1个master角色和N（N>=1）个backup角色。
master会通过组播的形式向各个backup发送VRRP协议的数据包，当backup收不到master发来的VRRP数据包时，就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。
Keepalived要有三个模块，分别是core、check和vrrp。其中core模块为keepalived的核心，负责主进程的启动、维护以及全局配置文件的加载和解析，check模块负责健康检查，vrrp模块是来实现VRRP协议的。

18.3-18.5 用Keepalived配置高可用集群

准备两台机器130和132，130作为master，132作为backup
 两台机器都执行yum install -y keepalived
 两台机器都安装nginx，其中130上已经编译安装过nginx，132上需要yum安装nginx: yum install -y nginx
 设定vip为100
 编辑130上keepalived配置文件，内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/master_keepalived.conf获取
 130编辑监控脚本，内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/master_check_ng.sh获取
 给脚本755权限
 systemctl start  keepalived 130启动服务
132上编辑配置文件，内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_keepalived.conf获取
 132上编辑监控脚本，内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_check_ng.sh获取
 给脚本755权限
 132上也启动服务 systemctl start keepalived

环境准备:

两台虚拟机：
系统：centos 7.3_64位
master：192.168.8.131；编译安装nginx；yum install -y keepalived
backup：192.168.8.130；yum install -y nginx；yum install -y keepalived
VIP：192.168.8.100
注： VIP（virtual IP）虚拟IP，由Keepalived设置，用于服务器对外提供服务。

安装keepalived

master

安装Keepalived：
[root@Dasoncheng ~]# yum install -y keepalived
查看nginx版本：
[root@Dasoncheng ~]# /usr/local/nginx/sbin/nginx -v
nginx version: nginx/1.12.1

backup

安装Keepalived：
[root@localhost ~]# yum install -y keepalived

安装nginx：
[root@localhost ~]# yum install -y nginx
查看nginx版本：
[root@localhost ~]# nginx -v
nginx version: nginx/1.10.2

master配置：

配置Keepalived：
在此使用自定义的Keepalived配置文件脚本(先清空或删除自带配置文件脚本)。
[root@Dasoncheng ~]# vim /etc/keepalived/keepalived.conf
global_defs {
   notification_email {
     aming@aminglinux.com                          
   }                                               #定义故障提醒邮件接收地址（本实验用不到）
   notification_email_from root@aminglinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30                         
   router_id LVS_DEVEL                             #定义故障提醒邮件发送地址（本实验用不到）
}
vrrp_script chk_nginx {                            #定义监控脚本
    script "/usr/local/sbin/check_ng.sh"           #指定服务健康检测（check）脚本
    interval 3                                     #检测时间间隔
}
vrrp_instance VI_1 {                               
    state MASTER                                   #定义该服务的角色 
    interface ens33                                #定义在本机中监听VIP的网卡
    virtual_router_id 51                           #虚拟路由id（同组中的服务器保持该id一致）
    priority 100                                   #指定本机权重（决定优先级）
    advert_int 1                                   
    authentication {                               #定义认证相关信息  
        auth_type PASS                             #认证类型为密码形式
        auth_pass 123456                           #定义认证密码
    }
    virtual_ipaddress {                            #定义VIP
        192.168.188.100
    }
    track_script {                                 #加载监控服务（脚本）
        chk_nginx                                  #注意此处服务名称要与上面监控脚本名称一致
    }
}

创建监控脚本：

[root@Dasoncheng ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量，用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0，则启动nginx，并且再次检测nginx进程数量，
#如果还为0，说明nginx无法启动，此时需要关闭keepalived
if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived      #在此停止Keepalived服务是为了避免发生脑裂
        fi
fi

更改脚本权限：
[root@Dasoncheng ~]# chmod 755 /usr/local/sbin/check_ng.sh

启动Keepalived服务：
[root@Dasoncheng ~]# systemctl start keepalived

检测服务状态：
[root@Dasoncheng ~]# ps aux |grep keep
root      4586  0.0  0.1 111708  1308 ?        Ss   15:44   0:00 /usr/sbin/keepalived -D
root      4587  0.1  0.2 111708  2556 ?        S    15:44   0:00 /usr/sbin/keepalived -D
root      4588  0.6  0.1 111708  1620 ?        S    15:44   0:00 /usr/sbin/keepalived -D
root      4682  0.0  0.0 112664   972 pts/1    S+   15:45   0:00 grep --color=auto keep
[root@Dasoncheng ~]# ps aux |grep nginx
root      3380  0.0  0.1  45352  1164 ?        Ss   14:15   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody    3381  0.0  0.4  47840  4064 ?        S    14:15   0:00 nginx: worker process
nobody    3382  0.0  0.3  47840  3804 ?        S    14:15   0:00 nginx: worker process
root      4696  0.0  0.0 112664   976 pts/1    R+   15:45   0:00 grep --color=auto nginx
[root@Dasoncheng ~]# /etc/init.d/nginx stop
Stopping nginx (via systemctl):                            [  确定  ]
[root@Dasoncheng ~]# ps aux |grep nginx
root      4814  0.0  0.1  45352  1184 ?        Ss   15:46   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody    4816  0.0  0.3  47840  3820 ?        S    15:46   0:00 nginx: worker process
nobody    4817  5.0  0.3  47840  3820 ?        S    15:46   0:00 nginx: worker process
root      4827  0.0  0.0 112664   976 pts/1    S+   15:46   0:00 grep --color=auto nginx
注：由以上检测状态可知关闭nginx服务之后Keepalived会再次自动启动nginx服务

注释：“脑裂”，即当master宕机后仍然未释放VIP，同时backup接替master提供服务要使用同一VIP，因而导致两台机器争占同一VIP导致服务紊乱，所以当master宕机后需要关闭其Keepalived服务来避免脑裂现象发生。Keepalived服务的日志位置：/var/log/messages。

[root@Dasoncheng ~]# ip add    //查看网卡信息，此处不能用ifconfig查看；因为ens33中增加了一个IP：192.168.8.100/32；
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff
    inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33
       valid_lft forever preferred_lft forever
    inet 192.168.8.100/32 scope global ens33
       valid_lft forever preferred_lft forever

backup配置：

配置Keepalived：同样使用自定义脚本。  
[root@localhost ~]# vim /etc/keepalived/keepalived.conf
global_defs {
   notification_email {
     aming@aminglinux.com
   }
   notification_email_from root@aminglinux.com
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}
vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
    interval 3
}
vrrp_instance VI_1 {       #只有该部分与master有区别
    state BACKUP           #角色
    interface ens33        
    virtual_router_id 51   
    priority 90            #权重，如果是多台服务器，权重决定了master宕机后，backup接管master角色的顺序。
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    virtual_ipaddress {
        192.168.8.100
    }   
    track_script {
        chk_nginx
    }   
}

创建监控脚本：

[root@localhost ~]# vim /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量，用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0，则启动nginx，并且再次检测nginx进程数量，
#如果还为0，说明nginx无法启动，此时需要关闭keepalived
if [ $n -eq "0" ]; then
        systemctl start nginx
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

更改脚本权限：
[root@localhost ~]# chmod 755 /usr/local/sbin/check_ng.sh

启动Keepalived服务：
[root@localhost ~]# systemctl start keepalived.service

说明：该检测脚本中与master检测脚本的区别在于：systemctl start nginx，即nginx的启动方式，因为在backup服务器中是使用yum安装的nginx，默认添加到系统服务中。

测试：

master宕机前：
mark
backup：
mark
使用VIP访问：（此时默认访问到master服务器。） mark
master宕机后：

[root@Dasoncheng ~]# systemctl stop keepalived.service  //关闭master的keepalived，模拟宕机情景；
[root@Dasoncheng ~]# ip add    //查看master上IP状态；ens33上已经没有了VIP。
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:8a:1b:5c brd ff:ff:ff:ff:ff:ff
    inet 192.168.8.131/24 brd 192.168.8.255 scope global ens33
       valid_lft forever preferred_lft forever
    inet6 fe80::65d2:adc:20d3:8c74/64 scope link 
       valid_lft forever preferred_lft forever

[root@localhost ~]# ip add    //查看back上IP状态： VIP转移到backup的ens33网卡上。然后使用浏览器访问VIP。
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:40:9f:e7 brd ff:ff:ff:ff:ff:ff
    inet 192.168.8.130/24 brd 192.168.8.255 scope global ens33
       valid_lft forever preferred_lft forever
    inet 192.168.8.100/32 scope global ens33
       valid_lft forever preferred_lft forever
    inet6 fe80::b61a:f99d:bfc0:e0b5/64 scope link 
       valid_lft forever preferred_lft forever

master宕机后由backup继续提供服务。 mark