引言:Haproxy是一个使用C语言编写的自由及开放式源代码软件,主要用于提供高可用、负载均衡;HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可以支持数以万计的 并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中, 同时可以保护你的web服务器不被暴露到网络上。
一、HAproxy概述
HAproxy是可提供高可用性、负载均衡以及基于TCP和HTTP应用代理,是免费、快速并且可靠的一种解决方案,HAproxy非常适用于并发量大(并发1w以上)web站点,这些站点通常又需要会话保持或七层处理,HAproxy的运行模式使得它可以很简单安全的整合至当前的架构中,同时可以保护web服务器不被暴露到网络上
1.HAproxy的主要特性
1可靠性和稳定性非常好,可以与硬件级的F5负载均衡设备相媲美
2最高可以同时维护40000-50000个并发连接,单位时间内处理最大请求数20000个,最大处理能力可达10Git/s;
3支持多达8中负载均衡算法,同时也支持会话爆出
4支持虚拟主机功能,从而实现web负载均衡更加灵活
5支持连接拒绝、全透明代理等独特的功能
6拥有强大的ACL支持,用于访问控制
7其独特的弹性二叉树数据结构,使结构的复杂性上升到了0(1),即数据的查询速度不会随着数据条目的增加而速度有所下降
8支持客户端的keepalived功能,减少客户端与haproxy的多次三次握手导致资源浪费,让多个请求在一个tcp连接中完成;
9支持TCP加速,零复制功能,类似于mmap机制;
10支持响应池(response buffering);
11基于源的粘性,类似nginx的ip_hash功能,把来自同一客户端的请求在一定时间内始终调度到上游的同一服务器;
12更好统计数据接口,其web接口显示后端集群中各个服务器的接收、发送、拒绝、错误等数据的统计信息
13详细的健康状态检测,web接口中有关于对上游服务器的健康检测状态,并提供了一定的管理功能
14基于流量的健康评估机制
15基于http认证
16基于命令行的管理接口
17日志分析器,可对日志进行分析
2.HAproxy负载均衡策略
roundrobin,表示简单的轮询
static-rr,表示根据权重
leastconn,表示最少连接者先处理
source,表示根据请求源IP
uri,表示根据请求的URI,做cdn需使用
url_param,表示根据请求的URI参数"balance url_param" requires an URL parameter name
hdr(name),表示根据HTTP请求头来锁定每一次HTTP请求
rdp-cookie(name),表示根据cookie(name)来锁定并哈希每一次TCP请求
3.LVS、Nginx、HAproxy的区别
(1)LVS基于Linux操作系统内核实现软负载均衡,而HAproxy和Nginx是基于第三方应用实现的软负载均衡
(2)LVS是可实现4层的IP负载均衡技术,无法实现基于目录、URL的转发,而HAproxy和Nginx都可以实现4层和7层技术,HAproxy可提供TCP和HTTP应用的负载均衡综合解决方案
(3)LVS因为工作在ISO模型的第四层,其状态监测功能单一,而HAproxy在状态监测方面功能更丰富、强大,可支持端口、URL、脚本灯多种监测方式
(4)HAproxy功能强大,但整体性能低于4层模式的LVS负载均衡
(5)Nginx主要用于Web服务器或缓存服务器,Nginx的upstream模块虽然也支持群集功能,但是对群集节点健康检查功能不强,性能没有HAproxy好
(6)Haproxy也是支持虚拟主机的
(7)Haproxy支持8种负载均衡器策略
(8)Haproxy的优点能补充nginx的一些缺点,比如支持Session的保持,Cookie的引导,同时支持通过获取指定url来监测后端服务器的状态
(9)Haproxy和LVS类似,本身就只是一款负载均衡软件,单纯从效率上来讲Haproxy会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的
(10)Haproxy支持TCP协议的负载均衡转发
4.常见Web集群调度器
目前常见的Web集群调度器分为软件和硬件
软件通常使用开源的LVS、HAproxy、Nginx
硬件一般使用比较多的是F5,当然也有很多人使用国内的一些产品,如梭子鱼、绿盟、深信服
5.Haproxy应用分析
5.1LVS在企业应用中抗负载能力很强,但存在不足
LVS不支持正则处理,不能实现动静分离
对于大型网站,LVS的实施配置复杂,维护成本相对较高
5.2HAproxy是一款可提供高可用性、负载均衡、及TCP和HTTP应用的代理的软件
适用于负载大的Web站点
运行在硬件上可支持数以万计的并发连接的连接请求
二、HAproxy搭建Web群集
实验拓扑
HAproxy服务器:192.168.154.188
Nginx 服务器1:192.168.154.21
Nginx 服务器2:192.168.154.22
客户端:192.168.154.19
1.HAproxy服务器部署
(1)关闭防火墙
systemctl stop firewalld 关闭防火墙
setenforce 0
haproxy-1.5.19.tar.gz 上传Haproxy软件安装包
(2) 编译安装HAproxy
yum install -y pcre-devel bzip2-devel gcc gcc-c++ make 安装依赖环境
解压安装包,切换到该目录下
tar zxf haproxy-1.5.18.tar.gz
cd haproxy-1.5.19/
编译安装
uname -r
make TARGET=linux2628 ARCH=x86_64
make install
####################参数说明###################
TARGET=linux26 #内核版本,
#使用uname -r查看内核,如:2.6.18-371.el5,此时该参数用TARGET=linux26;kernel大于2.6.28的用TARGET=linux2628
ARCH=x86_64 #系统位数,64位系统
HAproxy服务器配置
mkdir /etc/haproxy
cp /examples/haproxy.cfg /etc/haproxy/
cd /etc/haproxy/
vim haproxy.cfg
global
--4~5行--修改,配置日志记录,local0为日志设备,默认存放到系统日志
log /dev/log local0 info
log /dev/log local0 notice
#log loghost local0 info
maxconn 4096 #最大连接数,需考虑ulimit -n限制
--8行--注释,chroot运行路径,为该服务自设置的根目录,一般需将此行注释掉
#chroot /usr/share/haproxy
uid 99 #用户UID
gid 99 #用户GID
daemon #守护进程模式
defaults
log global #定义日志为global配置中的日志定义
mode http #模式为http
option httplog #采用http日志格式记录日志
option dontlognull #不记录健康检查日志信息
retries 3 #检查节点服务器失败次数,连续达到三次失败,则认为节点不可用
redispatch #当服务器负载很高时,自动结束当前队列处理比较久的连接
maxconn 2000 #最大连接数
#contimeout 5000 #连接超时时间
#clitimeout 50000 #客户端超时时间
#srvtimeout 50000 #服务器超时时间
timeout http-request 10s #默认http请求超时时间
timeout queue 1m #默认队列超时时间
timeout connect 10s #默认连接超时时间,新版本中替代contimeout,该参数向后兼容
timeout client 1m #默认客户端超时时间,新版本中替代clitimeout,该参数向后兼容
timeout server 1m #默认服务器超时时间,新版本中替代srvtimeout,该参数向后兼容
timeout http-keep-alive 10s #默认持久连接超时时间
timeout check 10s #设置心跳检查超时时间
--删除下面所有listen项--,添加
listen webcluster 0.0.0.0:80 #定义一个名为webcluster的应用
option httpchk GET /boss.html #检查服务器的index.html文件
balance roundrobin #负载均衡调度算法使用轮询算法roundrobin
server inst1 192.168.154.21:80 check inter 2000 fall 3 #定义在线节点
server inst2 192.168.154.22:80 check inter 2000 fall 3
##########################参数说明########################
balance roundrobin #负载均衡调度算法
#轮询算法:roundrobin;最小连接数算法:leastconn;来源访问调度算法:source,类似于nginx的ip_hash
check inter 2000 #表示haproxy服务器和节点之间的一个心跳频率
fall3 #表示连续三次检测不到心跳频率则认为该节点失效
若节点配置后带有“backup”表示该节点只是个备份节点,只有主节点失效该节点才会上。不携带“backup”,表示为主节点,和其它主节点共同提供服务。
2.配置Nginx服务器1
#关闭防火墙
systemctl stop firewalld
setenforce 0
##方法一、通过编译安装的方式安装Nginx
#安装依赖关系包
yum -y install pcre-devel zlib-devel gcc gcc-c++ make
3. #新建用户和组便于管理
useradd -M -s /sbin/nologin nginx
4. #切换至opt目录,将下载好的压缩包传进来解压
cd /opt
tar -zxf nginx-1.12.0.tar.gz
5. #切换至解压后的目录下编译
cd nginx-1.12.0
./configure \
--prefix=/usr/local/nginx \
--user=nginx \
--group=nginx \
--with-http_stub_status_module
6. #安装
make && make install -j4
7. #做软连接,让系统识别nginx的操作命令
ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/
8. #将nginx命令加入服务
cd /lib/systemd/system
vim nginx.service
#!/bin.bash
[Unit]
Description=nginx
After=network.target
[Service]
Type=forking
PIDFile=/usr/local/nginx/logs/nginx.pid
ExecStart=/usr/local/nginx/sbin/nginx
ExecReload=/usr/bin/kill -s HUP $MAINPID
ExecStop=/usr/bin/kill -s QUIT $MAINPID
PrivateTmp=true
[Install]
WantedBy=multi-user.target
##方法二、yum安装Nginx
配置nginx源
[nginx]
name=nginx repo
baseurl=https://nginx.org/packages/centos/7/$basearch/
enabled=1
gpgcheck=0
下载
yum install -y nginx
#创建站点目录
echo "hello user1" > /usr/local/nginx/html/text.html
cat /usr/share/nginx/html/text.html
#重新加载单元.启动服务
systemctl daemon-reload
systemctl start nginx
#查看是否能成功启动
netstat -ntap|grep nginx
为了测试haproxy负载均衡是否跳转,需要修改
vim /etc/nginx/conf.d/default.conf
systemctl restart nginx
重启服务
systemctl start nginx
3.节点服务器2
1. #关闭防火墙
systemctl stop firewalld
setenforce 0
2.从第一天节点服务器远程复制到本台机器
scp nginx.repo root@192.168.154.22:/etc/yum.repos.d/
yum install -y nginx
3.. #创建站点目录
echo "hello user2" > /usr/local/nginx/html/text.html
cat /usr/local/nginx/html/text.html
4. #重新加载单元.启动服务
systemctl daemon-reload
systemctl start nginx
5. #查看是否能成功启动
ss -ntap|grep nginx
6.修改配置文件匹配目录
为了测试haproxy负载均衡是否跳转,需要修改
vim /etc/nginx/conf.d/default.conf
systemctl restart nginx
4.浏览器测试验证
全部测试完成后,启动haproxy服务,否则会报错
三、Haproxy集群日志重新定义
Haproxy的日志默认输出到系统的syslog种,操作时想要查看日志很麻烦,为了更好的管理haproxy的日志,在生产环境中一般单独定义出来,需要将haproxy的info和notice分别记录到不同日志文件中
需要修改rsyslog配置,为了便于管理,将haproxy相关配置独立定义到haproxy.conf,并放到/etc/rsyslog.d下,rsyslog启动时会自动加载此目录下所有配置文件
vim /etc/haproxy/haproxy.cfg
global
log /dev/log local0 info
log /dev/log local0 notice
service haproxy restart
#需要修改rsyslog配置,为了便于管理。将haproxy相关的配置独立定义到haproxy.conf,并放到/etc/rsyslog.d/下,rsyslog启动时会自动加载此目录下的所有配置文件。
vim /etc/rsyslog.d/haproxy.conf
if ($programname == 'haproxy' and $syslogseverity-text == 'info')
then -/var/log/haproxy/haproxy-info.log
&~
if ($programname == 'haproxy' and $syslogseverity-text == 'notice')
then -/var/log/haproxy/haproxy-notice.log
&~
#说明:
这部分配置是将haproxy的info日志记录到/var/log/haproxy/haproxy-info.log下,将notice日志记录到/var/log/haproxy/haproxy-notice.log下。“&~”表示当日志写入到日志文件后,rsyslog停止处理这个信息。
systemctl restart rsyslog.service
tail -f /var/log/haproxy/haproxy-info.log #查看haproxy的访问请求日志信息
配置完成后重启haproxy服务,并在网页上刷新一下,
haproxy日志就会显示,出现haproxy-notice.log
总结
HAproxy和Nginx都是基于第三方应用实现的软负载均衡,HAproxy的功能强大,但整体性能低于4层模式的LVS负载均衡