haproxy
概念
HAProxy是一个使用C语言编写的自由及开放源代码软件,其提供高可用性、负载均衡,以及基于TCP和HTTP的应用程序代理。
- HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中, 同时可以保护你的web服务器不被暴露到网络上。
- HAProxy实现了一种事件驱动, 单一进程模型,此模型支持非常大的并发连接数。多进程或多线程模型受内存限制 、系统调度器限制以及无处不在的锁限制,很少能处理数千并发连接。事件驱动模型因为在有更好的资源和时间管理的用户空间(User-Space) 实现所有这些任务,所以没有这些问题。此模型的弊端是,在多核系统上,这些程序通常扩展性较差。这就是为什么他们必须进行优化以 使每个CPU时间片(Cycle)做更多的工作。
- HAProxy 支持连接拒绝 : 因为维护一个连接的打开的开销是很低的,有时我们很需要限制攻击蠕虫(attack bots),也就是说限制它们的连接打开从而限制它们的危害。 这个已经为一个陷于小型DDoS攻击的网站开发了而且已经拯救了很多站点,这个优点也是其它负载均衡器没有的。
- HAProxy 支持全透明代理(已具备硬件防火墙的典型特点): 可以用客户端IP地址或者任何其他地址来连接后端服务器. 这个特性仅在Linux 2.4/2.6内核打了cttproxy补丁后才可以使用. 这个特性也使得为某特殊服务器处理部分流量同时又不修改服务器的地址成为可能。
proxy&Haproxy
相同点:在功能上,proxy通过反向代理方式实现 WEB均衡负载。和 Nginx,ApacheProxy,lighttpd,Cheroke 等一样。
不同点:Haproxy 并不是 web 服务器。以上提到所有带反向代理均衡负载的产品,都清一色是 WEB 服务器。简单说,就是他们能处理解析页面的。而Haproxy 仅仅是一款的用于均衡负载的应用代理。其自身并不能提供web服务。但其配置简单,拥有非常不错的服务器健康检查功能还有专门的系统状态监控页面,当其代理的后端服务器出现故障, HAProxy会自动将该服务器摘除,故障恢复后再自动将该服务器加入。
简单的实现
实验设备:
web node1 192.168.0.196
web node2 192.168.0.197
ha node3 192.168.0.151
ha安装方式:
- rpm 包方式:
rpmbuild -tb haproxy-1.4.23.tar.gz
rpm -ivh /root/rpmbuild/RPMS/x86_64/haproxy-1.4.23-1.x86_64.rpm
- 源码方式:
tar zxf haproxy-1.4.23.tar.gz
cd haproxy-1.4.23
make TARGET=linux26 ARCH=x86_64 USE_PCRE=1 PREFIX=/usr/local/haproxy install
node3
yum install haproxy -y (建议用rpm包装)
cd /etc/haproxy/
vim haproxy.cfg
> ###配置文件说明 global log 127.0.0.1 local2 #全局的日志配置,使用log关键字 chroot /var/lib/haproxy #改变当前工作目录
> #修改haproxy的工作目录至指定的目录并在放弃权限之前执行chroot()操作,可以提升haproxy的安全级别,不过需要注意的是要确保指定的目录为空目录且任何用户均不能有写权限
>
> pidfile /var/run/haproxy.pid #当前进程id文件 maxconn 4000
> #设定每个haproxy进程所接受的最大并发连接数 user haproxy group haproxy daemon #让haproxy以守护进程的方式工作于后台
>
> defaults
> mode http #默认的模式mode { tcp|http|health },tcp是4层,http是7层,health只会返回OK
> log global #应用全局的日志配置
> option httplog # 启用日志记录HTTP请求,默认haproxy日志记录是不记录HTTP请求日志
> option dontlognull
> # 启用该项,日志中将不会记录空连接。所谓空连接就是在上游的负载均衡器
> # 或者监控系统为了探测该服务是否存活可用时,需要定期的连接或者获取某固定的组件或页面,
> # 或者探测扫描端口是否在监听或开放等动作被称为空连接;官方文档中标注,
> # 如果该服务上游没有其他的负载均衡器的话,建议不要使用该参数,
> # 因为互联网上的恶意扫描或其他动作就不会被记录下来
> option http-server-close #每次请求完毕后主动关闭http通道
> option forwardfor except 127.0.0.0/8
> option redispatch
> # 当使用了cookie时,haproxy将会将其请求的后端服务器的serverID插入到cookie中,
> # 以保证会话的SESSION持久性;而此时,如果后端的服务器宕掉了,
> # 但是客户端的cookie是不会刷新的,如果设置此参数,
> # 将会将客户的请求强制定向到另外一个后端server上,
> # 以保证服务的正常。
>
> retries