简介

HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。根据官方数据,其最高极限支持10G的并发。

 

 HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中,同时可以保护你的web服务器不被暴露到网络上。

 

 其支持从4层至7层的网络交换,即覆盖所有的TCP协议。就是说,Haproxy甚至还支持 Mysql 的均衡负载(read)。

 

 如果说在功能上,能以proxy反向代理方式实现WEB均衡负载,这样的产品有很多。包括 Nginx,ApacheProxy,lighttpd,Cheroke 等。

 

 但要明确一点的,Haproxy并不是 Http 服务器。以上提到所有带反向代理均衡负载的产品,都清一色是 WEB 服务器。简单说,就是他们能自个儿提供静态(html,jpg,gif..)或动态(php,cgi..)文件的传输以及处理。而Haproxy 仅仅,而且专门是一款的用于均衡负载的应用代理。其自身并不能提供http服务。

 

 但其配置简单,拥有非常不错的服务器健康检查功能还有专门的系统状态监控页面,当其代理的后端服务器出现故障, HAProxy会自动将该服务器摘除,故障恢复后再自动将该服务器加入。自1.3版本开始还引入了frontend、backend,frontend根据任意HTTP请求头内容做规则匹配,然后把请求定向到相关的backend。

 

  还支持如下新特性: 

 

  • 内容交换:  
     可以根据请求(request)的任何一部分 来选择一组服务器, 比如请求的 URI ,Host头(header) , cookie , 以及其他任何东西. 当然,对那些静态分离的站点来说,对此特性还有更多的需求。

 

  • 全透明代理:   
     可以用客户端IP地址 或者任何其他地址来连接后端服务器,这个特性仅在Linux 2.4/2.6内核打了cttproxy 补丁后才可以使用。这个特性也使得为某特殊服务器处理部分流量同时又不修改服务器的地址成为可能。

 

  • 基于树的更快的调度器:  
     1.2.16以上的版本要求所有的超时都设成同样的值以支持数以万计的全速连接. 这个特性已经移植到1.2.17 

 

  • 内核TCP拼接 
     避免了内核到用户然后用户到内核端的数据拷贝,提高了吞吐量同时又降低了CPU使用率 . Haproxy 1.3支持Linux L7SW 以满足在商用硬件上数Gbps 的吞吐的需求。

 

  • 连接拒绝:  
     因为维护一个连接的打开的开销是很低的,有时我们很需要限制***蠕虫(attack bots),也就是说限制它们的连接打开从而限制它们的危害。这个已经为一个陷于小型DDoS***的网站开发了而且已经拯救了很多站点。

 

  • 细微的头部处理 
     使得编写基于header的规则更为简单,同时可以处理URI的某部分。 

 

  • 快而可靠的头部处理:  
     使用完全RFC2616 兼容的完整性检查对一般的请求全部进行分析和索引仅仅需要不到2ms的时间。 

 

  • 模块化设计:  
     允许更多人加入进此项目,调试也非常简单.poller已经分离, 已经使得它们的开发简单了很多。HTTP已经从TCP分离出来了,这样增加新的七层特性变得非常简单,其他子系统也会很快实现模块化。

 

  • 投机I/O 处理:  
     在一个套接字就绪前就尝试从它读取数据。poller仅推测哪个可能就绪哪个没有,尝试猜测,并且如果成功,一些开销很大的系统调用就可以省去了。如果失败,就会调用这些系统调用。已知的使用Linux epoll()已经净提升起码10%了。

 

  • ACLs:  
     使用任意规则的任意组合作为某动作的执行条件。 

 

  • TCP协议检查:  
     结合ACL来对请求的任意部分进行检查,然后再进行转发。这就可以执行协议验证而不是盲目的进行转发。比如说允许SSL但拒绝SSH 

 

  • 更多的负载均衡算法:  
    动态加权轮循(Dynamic Round Robin),加权源地址哈希(Weighted Source Hash),加权URL哈希和加权参数哈希(Weighted Parameter Hash)

 

优点

  • HAProxy支持虚拟主机的,可以工作在47(支持多网段)

  • 能够补充Nginx的一些缺点比如Session的保持,Cookie的引导等工作;

  • 支持url检测后端的服务器;

  • 它跟LVS一样,本身仅仅就只是一款负载均衡软件;单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度,在并发处理上也是优于Nginx的;

  • HAProxy可以对Mysql读进行负载均衡,对后端的MySQL节点进行检测和负载均衡,不过在后端的MySQL slaves数量超过10台时性能不如LVS

  • HAProxy的算法较多,达到8种;

 

配置文件详解

 

Haproxy配置文件位于/etc/haproxy/haproxy.cfg

文件内容结构

  • global      
     #全局配置

  • defaults                
     #默认配置段,通常定义frontendbackendlisten的共同参数

  • frontend               
     #定义一系列监听的套接字,这些套接字可接受客户端请求并与之建立连接

  • backend
     #定义一系列“后端”服务器,代理将会将对应客户端的请求转发至这些服务器

  • listen
     #通过关联“前端”和“后端”定义了一个完整的代理,通常只对TCP流量有用

 

 1. global段配置参数(红色字为常用)

    chroot <jail dir>
    修改haproxy的工作目录至指定的目录并在放弃权限之前执行chroot()操作,可以提升haproxy的安全级别,不过需要注意的是要确

    保指定的目录为空目录且任何用户均不能有写权限;

    daemon

  haproxy以守护进程的方式工作于后台,其等同于“-D”选项的功能,当然,也可以在命令行中以“-db”选项将其禁用;

    gid<number>

    以指定的GID运行haproxy,建议使用专用于运行haproxyGID,以免因权限问题带来风险;

    group <group name>

    gid,不过指定的组名;

    log  <address><facility> [max level [min level]]

    定义全局的syslog服务器,最多可以定义两个;

    log-send-hostname [<string>]

    syslog信息的首部添加当前主机名,可以为“string”指定的名称,也可以缺省使用当前主机名;

    nbproc <number>

    指定启动的haproxy进程的个数,只能用于守护进程模式的haproxy;默认只启动一个进程,鉴于调试困难等多方面的原因,一般只

    在单进程仅能打开少数文件描述符的场景中才使用多进程模式;

    pidfile

    pid文件路径设定

    uid

    以指定的UID身份运行haproxy进程;

    user

    uid,但使用的是用户名;

    ulimit-n

    设定每进程所能够打开的最大文件描述符数目,默认情况下其会自动进行计算,因此不推荐修改此选项;

    stats

    node

    定义当前节点的名称,用于HA场景中多haproxy进程共享同一个IP地址时;

    description

    当前实例的描述信息;

    maxconn <number>

    设定每个haproxy进程所接受的最大并发连接数,其等同于命令行选项“-n”;“ulimit -n”自动计算的结果正是参照此参数设定

    的;

    maxpipes<number>

    haproxy使用pipe完成基于内核的tcp报文重组,此选项则用于设定每进程所允许使用的最大pipe个数;每个pipe会打开两个文件描

    述符,因此,“ulimit -n”自动计算时会根据需要调大此值;默认为maxconn/4,其通常会显得过大

 

  2.其余三段的参数,注意使用范围

    balance 负载均衡

    语法:

    balance <algorithm> [ <arguments> ]

    balance url_param <param> [check_post[<max_wait>]]

 

  定义负载均衡算法,可用于“defaults”、“listen”和“backend”。<algorithm>用于在负载均衡场景中挑选一个server,其仅应用
  于持久信息不可用的条件下或需要将一个连接重新派发至另一个服务器时。支持的算法有:

 

  • roundrobin:基于权重进行轮叫,在服务器的处理时间保持均匀分布时,这是最平衡、最公平的算法。此算法是动态的,这表示其权重可以在运行时进行调整,不过,在设计上,每个后端服务器仅能最多接受4128个连接;

  • static-rr:基于权重进行轮叫,与roundrobin类似,但是为静态方法,在运行时调整其服务器权重不会生效;不过,其在后端服务器连接数上没有限制;

  • leastconn:新的连接请求被派发至具有最少连接数目的后端服务器;在有着较长时间会话的场景中推荐使用此算法,如LDAPSQL等,其并不太适用于较短会话的应用层协议,如HTTP;此算法是动态的,可以在运行时调整其权重;

  • source:将请求的源地址进行hash运算,并由后端服务器的权重总数相除后派发至某匹配的服务器;这可以使得同一个客户端IP的请求始终被派发至某特定的服务器;不过,当服务器权重总数发生变化时,如某服务器宕机或添加了新的服务器,许多客户端的请求可能会被派发至与此前请求不同的服务器;常用于负载均衡无cookie功能的基于TCP的协议;其默认为静态,不过也可以使用hash-type修改此特性;

  • uri:对URI的左半部分(“问题”标记之前的部分)或整个URI进行hash运算,并由服务器的总权重相除后派发至某匹配的服务器;这可以使得对同一个URI的请求总是被派发至某特定的服务器,除非服务器的权重总数发生了变化;此算法常用于代理缓存或反病毒代理以提高缓存的命中率;需要注意的是,此算法仅应用于HTTP后端服务器场景;其默认为静态算法,不过也可以使用hash-type修改此特性;

  • url_param:通过<argument>URL指定的参数在每个HTTP GET请求中将会被检索;如果找到了指定的参数且其通过等于号“=”被赋予了一个值,那么此值将被执行hash运算并被服务器的总权重相除后派发至某匹配的服务器;此算法可以通过追踪请求中的用户标识进而确保同一个用户ID的请求将被送往同一个特定的服务器,除非服务器的总权重发生了变化;如果某请求中没有出现指定的参数或其没有有效值,则使用轮叫算法对相应请求进行调度;此算法默认为静态的,不过其也可以使用hash-type修改此特性;

  • hdr(<name>):对于每个HTTP请求,通过<name>指定的HTTP首部将会被检索;如果相应的首部没有出现或其没有有效值,则使用轮叫算法对相应请求进行调度;其有一个可选选项“use_domain_only”,可在指定检索类似Host类的首部时仅计算域名部分(比如通过www.magedu.com来说,仅计算magedu字符串的hash)以降低hash算法的运算量;此算法默认为静态的,不过其也可以使用hash-type修改此特性;

  • rdp-cookie

  • rdp-cookie(name)

 

    bind 监听地址、端口的绑定

    语法:

    bind [<address>]:<port_range> [, ...]

    bind [<address>]:<port_range> [, ...]interface <interface>

 

  此指令仅能用于frontendlisten区段,用于定义一个或几个监听的套接字。

 

  • <address>:可选选项,其可以为主机名、IPv4地址、IPv6地址或*;省略此选项、将其指定为*0.0.0.0时,将监听当前系统的所有IPv4地址;

  • <port_range>:可以是一个特定的TCP端口,也可是一个端口范围(5005-5010),代理服务器将通过指定的端口来接收客户端请求;需要注意的是,每组监听的套接字<address:port>在同一个实例上只能使用一次,而且小于1024的端口需要有特定权限的用户才能使用,这可能需要通过uid参数来定义;

  • <interface>:指定物理接口的名称,仅能在Linux系统上使用;其不能使用接口别名,而仅能使用物理接口名称,而且只有管理有权限指定绑定的物理接口;

 

    mode 运行模式

    语法:

    mode { tcp|http|health }

 

  设定实例的运行模式或协议。当实现内容交换时,前端和后端必须工作于同一种模式(一般说来都是HTTP模式),否则将无法启动实例。

 

  • tcp:实例运行于纯TCP模式,在客户端和服务器端之间将建立一个全双工的连接,且不会对7层报文做任何类型的检查;此为默认模式,通常用于SSLSSHSMTP等应用;

  • http:实例运行于HTTP模式,客户端请求在转发至后端服务器之前将被深度分析,所有不与RFC格式兼容的请求都会被拒绝;

  • health:实例工作于health模式,其对入站请求仅响应“OK”信息并关闭连接,且不会记录任何日志信息;此模式将用于响应外部组件的健康状态检查请求;目前来讲,此模式已经废弃,因为tcphttp模式中的monitor关键字可完成类似功能;

 

    hash-type

    语法:

    hash-type <method>

 

  定义用于将hash码映射至后端服务器的方法;其不能用于frontend区段;可用方法有map-basedconsistent,在大多数场景下推荐使用
  默认的
map-based方法。

 

  • map-basedhash表是一个包含了所有在线服务器的静态数组。其hash值将会非常平滑,会将权重考虑在列,但其为静态方法,对在线服务器的权重进行调整将不会生效,这意味着其不支持慢速启动。此外,挑选服务器是根据其在数组中的位置进行的,因此,当一台服务器宕机或添加了一台新的服务器时,大多数连接将会被重新派发至一个与此前不同的服务器上,对于缓存服务器的工作场景来说,此方法不甚适用。

  • consistenthash表是一个由各服务器填充而成的树状结构;基于hash键在hash树中查找相应的服务器时,最近的服务器将被选中。此方法是动态的,支持在运行时修改服务器权重,因此兼容慢速启动的特性。添加一个新的服务器时,仅会对一小部分请求产生影响,因此,尤其适用于后端服务器为cache的场景。不过,此算法不甚平滑,派发至各服务器的请求未必能达到理想的均衡效果,因此,可能需要不时的调整服务器的权重以获得更好的均衡性。

 

    log日志的设定

    log global

    log <address> <facility> [<level>[<minlevel>]]

 

  为每个实例启用事件和流量日志,因此可用于所有区段。每个实例最多可以指定两个log参数,不过,如果使用
  了“
logglobal”且"global"段已经定了两个log参数时,多余的log参数将被忽略。

 

  • global:当前实例的日志系统参数同"global"段中的定义时,将使用此格式;每个实例仅能定义一次“log global”语句,且其没有任何额外参数;

  • <address>:定义日志发往的位置,其格式之一可以为<IPv4_address:PORT>,其中的portUDP协议端口,默认为514;格式之二为Unix套接字文件路径,但需要留心chroot应用及用户的读写权限;

  • <facility>:可以为syslog系统的标准facility之一;

  • <level>:定义日志级别,即输出信息过滤器,默认为所有信息;指定级别时,所有等于或高于此级别的日志信息将会被发送;

 

   案例:

  启用默认的日志记录。global段有默认设置了日志log    127.0.0.1 local2,但还需要进一步设定才能生效。


  • 首先编辑/etc/rsyslog.conf
    启用系统日志的UDPTCP监听:
    # Provides UDP syslog reception
    $ModLoad imudp
    $UDPServerRun 514


  • 并添加local2.*        /var/log/haproxy.log
    保存退出并重启服务生效
    service rsyslog restart

 

    maxconn 前端并发连接数

    maxconn <conns>

 

  • 设定一个前端的最大并发连接数,因此,其不能用于backend区段。对于大型站点来说,可以尽可能提高此值以便让haproxy管理连接队列,从而避免无法应答用户请求。当然,此最大值不能超出“global”段中的定义。此外,需要留心的是,haproxy会为每个连接维持两个缓冲,每个缓冲的大小为8KB,再加上其它的数据,每个连接将大约占用17KBRAM空间。这意味着经过适当优化后,有着1GB的可用RAM空间时将能维护40000-50000并发连接。


  • 如果为<conns>指定了一个过大值,极端场景下,其最终占据的空间可能会超出当前主机的可用内存,这可能会带来意想不到的结果;因此,将其设定了一个可接受值方为明智决定。其默认为2000

 

    default_backend 默认后端主机

    default_backend <backend>

 

  • 在没有匹配的"use_backend"规则时为实例指定使用的默认后端,因此,其不可应用于backend区段。在"frontend""backend"之间进行内容交换时,通常使用"use-backend"定义其匹配规则;而没有被规则匹配到的请求将由此参数指定的后端接收。

    <backend>:指定使用的后端的名称;

  • 使用案例:
    acl url_static       path_beg       -i /static /p_w_picpaths /javascript/stylesheets
    acl url_static       path_end       -i .jpg .gif .png .css .js
    use_backend static          if url_static
    default_backend            test

 

    server 后端服务器定义

    server <name> <address>[:port] [param*]

 

  为后端声明一个server,因此,不能用于defaultsfrontend区段。

 

  • <name>:为此服务器指定的内部名称,其将出现在日志及警告信息中;如果设定了"http-send-server-name",它还将被添加至发往此服务器的请求首部中;

  • <address>:此服务器的的IPv4地址,也支持使用可解析的主机名,只不过在启动时需要解析主机名至相应的IPv4地址;

  • [:port]:指定将连接请求所发往的此服务器时的目标端口,其为可选项;未设定时,将使用客户端请求时的同一相端口;

  • [param*]:为此服务器设定的一系参数;其可用的参数非常多,具体请参考官方文档中的说明,下面仅说明几个常用的参数;

 

  服务器或默认服务器参数:

  backup:设定为备用服务器,仅在负载均衡场景中的其它server均不可用于启用此server

  check:启动对此server执行健康状态检查,其可以借助于额外的其它参数完成更精细的设定,如:

  • inter <delay>:设定健康状态检查的时间间隔,单位为毫秒,默认为2000;也可以使用fastinterdowninter来根据服务器端状态优化此时间延迟;

  • rise <count>:设定健康状态检查中,某离线的server从离线状态转换至正常状态需要成功检查的次数;

  • fall <count>:确认server从正常状态转换为不可用状态需要检查的次数;

  • cookie <value>:为指定server设定cookie值,此处指定的值将在请求入站时被检查,第一次为此值挑选的server将在后续的请求中被选中,其目的在于实现持久连接的功能;

  • maxconn <maxconn>:指定此服务器接受的最大并发连接数;如果发往此服务器的连接数目高于此处指定的值,其将被放置于请求队列,以等待其它连接被释放;

  • maxqueue <maxqueue>:设定请求队列的最大长度;

  • observe <mode>:通过观察服务器的通信状况来判定其健康状态,默认为禁用,其支持的类型有“layer4”和“layer7”,“layer7”仅能用于http代理场景;

  • redir <prefix>:启用重定向功能,将发往此服务器的GETHEAD请求均以302状态码响应;需要注意的是,在prefix后面不能使用/,且不能使用相对地址,以免造成循环;
    例: server srv1 172.16.100.6:80 redir http://p_w_picpathserver.magedu.comcheck
    weight <weight>:权重,默认为1,最大值为2560表示不参与负载均衡;

 

  案例cookie的设定:

    backend test

         balanceroundrobin

         optionhttpchk

         cookieSERVERID insert indirect nocache  

          #这里用的是插入的方法,还有修改方法等,nocache表示可能有用户私有信息,所以不予缓存

         serverweb1 172.16.100.7:80 check inter 2 rise 1 fall 3 cookie web1

         #这里SERVERID是自定义的名称,用于haproxy自定对后端服务器返回给客户端的cookie插入的信息的名称

         #cookieweb1 为标识 172.16.100.7这台服务器所用的cookie名称,例如经haproxy返回一个cookie给客户端的时候

         #SERVERID的值将会等于web1

         #之后只要客户端每次请求,都会插入一个cookie,看到web1的值

 

    capture记录客户端请求首部信息到日志中

    capture request header <name> len <length>

  用途:捕获并记录指定的请求首部最近一次出现时的第一个值,仅能用于“frontend”和“listen”区段。捕获的首部值使用花括号{}
  括起来后添加进日志中。如果需要捕获多个首部值,它们将以指定的次序出现在日志文件中,并以竖线“|”作为分隔符。不存在的首部
  记录为空字符串,最常需要捕获的首部包括在虚拟主机环境中使用的“
Host”、上传请求首部中的“Content-length”、快速区别真实
  用户和网络机器人的“
User-agent”,以及代理环境中记录真实请求来源的“X-Forward-For”。

 

  • <name>:要捕获的首部的名称,此名称不区分字符大小写,但建议与它们出现在首部中的格式相同,比如大写首字母。需要注意的是,记录在日志中的是首部对应的值,而非首部名称。

  • <length>:指定记录首部值时所记录的精确长度,超出的部分将会被忽略。

  • 可以捕获的请求首部的个数没有限制,但每个捕获最多只能记录64个字符。为了保证同一个frontend中日志格式的统一性,首部捕获仅能在frontend中定义

 

  例: capture request header Host len 20

     capture request header User-Agent len 40

     还有另一个记录响应报文首部的capture response header同样用法

 

    自带的统计报告页面

    stats enable

  • 功用:启用基于程序编译时默认设置的统计报告,不能用于“frontend”区段。启用后的默认配置


      statsuri   : /haproxy?stats

      statsrealm : "HAProxy Statistics"

      statsauth  : no authentication

      statsscope : no restriction

     

  • 配置案例:

    backend public_www

       server websrv1 172.16.100.11:80

       stats enable #启用状态页面

       stats hide-version #隐藏版本信息

       stats scope   .

       stats uri     /haproxyadmin?stats

       stats realm   Haproxy\ Statistics

       stats auth    statsadmin:password

       stats auth    statsmaster:password

     

  • 参数说明:

  • stats scope
    启用统计报告并限定报告的区段,不能用于“frontend”区段。当指定此语句时,统计报告将仅显示其列举出区段的报告信息,所有其它区段的信息将被隐藏。如果需要显示多个区段的统计报告,此语句可以定义多次。需要注意的是,区段名称检测仅仅是以字符串比较的方式进行,它不会真检测指定的区段是否真正存在。

     

  • stats uri
    状态页面的访问路径设定
     

  • stats realm
    状态页面密码输入提示信息
     

  • stats auth <user>:<password>
    启用带认证的统计报告功能并授权一个用户帐号,其不能用于“frontend”区段。
     

  • <user>:授权进行访问的用户名;

  • <passwd>:此用户的访问密码,明文格式; 

  • 此语句将基于默认设定启用统计报告功能,并仅允许其定义的用户访问,其也可以定义多次以授权多个用户帐号。可以结合“stats realm”参数在提示用户认证时给出一个领域说明信息。在使用非法用户访问统计功能时,其将会响应一个“401 Forbidden”页面。其认证方式为HTTP Basic认证,密码传输会以明文方式进行,因此,配置文件中也使用明文方式存储以说明其非保密信息故此不能相同于其它关键性帐号的密码。

 

    stats admin 统计报告页面中的管理功能

    stats admin { if | unless } <cond>

 

  • 在指定的条件满足时启用统计报告页面的管理级别功能,它允许通过web接口启用或禁用服务器,不过,基于安全的角度考虑,统计报告页面应该尽可能为只读的。此外,如果启用了HAProxy的多进程模式,启用此管理级别将有可能导致异常行为。

 

  • 目前来说,POST请求方法被限制于仅能使用缓冲区减去保留部分之外的空间,因此,服务器列表不能过长,否则,此请求将无法正常工作。因此,建议一次仅调整少数几个服务器。下面是两个案例,第一个限制了仅能在本机打开报告页面时启用管理级别功能,第二个定义了仅允许通过认证的用户使用管理级别功能。

     

    backend stats_localhost

       stats enable

       stats admin if LOCALHOST

     

    backend stats_auth

       stats enable

       stats auth  haproxyadmin:password

     stats admin if TRUE

 

    option httplog

    option httplog [ clf ]

 

  • 启用记录HTTP请求、会话状态和计时器的功能。 

  • clf:使用CLF格式来代替HAProxy默认的HTTP格式,通常在使用仅支持CLF格式的特定日志分析器时才需要使用此格式。

  • 默认情况下,日志输入格式非常简陋,因为其仅包括源地址、目标地址和实例名称,而“option httplog”参数将会使得日志格式变得丰富许多,其通常包括但不限于HTTP请求、连接计时器、会话状态、连接数、捕获的首部及cookie、“frontend”、“backend”及服务器名称,当然也包括源地址和端口号等。

 

    option logasap

    no option logasap

 

  • 启用或禁用提前将HTTP请求记入日志,不能用于“backend”区段。 

  • 默认情况下,HTTP请求是在请求结束时进行记录以便能将其整体传输时长和字节数记入日志,由此,传较大的对象时,其记入日志的时长可能会略有延迟。“option logasap”参数能够在服务器发送complete首部时即时记录日志,只不过,此时将不记录整体传输时长和字节数。此情形下,捕获“Content-Length”响应首部来记录传输的字节数是一个较好选择。下面是一个例子。

  •  listen http_proxy 0.0.0.0:80

         mode http

         option httplog

         option logasap

         log 172.16.100.9 local2

 

    option forwardfor

    option forwardfor [ except <network> ] [ header<name> ] [ if-none ]

 

  • 允许在发往服务器的请求首部中插入“X-Forwarded-For”首部。

  • <network>:可选参数,当指定时,源地址为匹配至此网络中的请求都禁用此功能。

  • <name>:可选参数,可使用一个自定义的首部,如“X-Client”来替代“X-Forwarded-For”。有些独特的web服务器的确需要用于一个独特的首部。

  • if-none:仅在此首部不存在时才将其添加至请求报文问道中。

  • HAProxy工作于反向代理模式,其发往服务器的请求中的客户端IP均为HAProxy主机的地址而非真正客户端的地址,这会使得服务器端的日志信息记录不了真正的请求来源,“X-Forwarded-For”首部则可用于解决此问题。HAProxy可以向每个发往服务器的请求上添加此首部,并以客户端IP为其value

  • 需要注意的是,HAProxy工作于隧道模式,其仅检查每一个连接的第一个请求,因此,仅第一个请求报文被附加此首部。如果想为每一个请求都附加此首部,请确保同时使用了“option httpclose”、“option forceclose”和“option http-server-close”几个option

  • frontend www

       mode http

       option forwardfor except 127.0.0.1

 

    errorfile

    errorfile <code> <file>

 

  • 在用户请求不存在的页面时,返回一个页面文件给客户端而非由haproxy生成的错误代码;可用于所有段中。

  • <code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200400403408500502503504

  • <file>:指定用于响应的页面文件;

  • 例如:

    errorfile 400/etc/haproxy/errorpages/400badreq.http

    errorfile 403/etc/haproxy/errorpages/403forbid.http

    errorfile 503/etc/haproxy/errorpages/503sorry.http

 

    errorloc errorloc302

    errorloc <code> <url>

    errorloc302 <code> <url>

 

  • 请求错误时,返回一个HTTP重定向至某URL的信息;可用于所有配置段中。

  • <code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有200400403408500502503504

  • <url>Location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径;需要注意的是,如果URI自身错误时产生某特定状态码信息的话,有可能会导致循环定向;

  • 需要留意的是,这两个关键字都会返回302状态吗,这将使得客户端使用同样的HTTP方法获取指定的URL,对于非GET法的场景(POST)来说会产生问题,因为返回客户的URL是不允许使用GET以外的其它方法的。如果的确有这种问题,可以使用errorloc303来返回303状态码给客户端。

 

    errorloc303

    errorloc303 <code> <url>

 

  • 请求错误时,返回一个HTTP重定向至某URL的信息给客户端;可用于所有配置段中。

  • <code>:指定对HTTP的哪些状态码返回指定的页面;这里可用的状态码有400403408500502503504

  • <url>Location首部中指定的页面位置的具体路径,可以是在当前服务器上的页面的相对路径,也可以使用绝对路径;需要注意的是,如果URI自身错误时产生某特定状态码信息的话,有可能会导致循环定向;

  • 例如: 

    backend webserver

     server 172.16.100.6 172.16.100.6:80 check maxconn 3000 cookie srv01

     server 172.16.100.7 172.16.100.7:80 check maxconn 3000 cookie srv02

      errorloc403 /etc/haproxy/errorpages/sorry.htm

     errorloc 503 /etc/haproxy/errorpages/sorry.htm

 

    ACL

 

  • haproxyACL用于实现基于请求报文的首部、响应报文的内容或其它的环境状态信息来做出转发决策,这大大增强了其配置弹性。其配置法则通常分为两步,首先去定义ACL,即定义一个测试条件,而后在条件得到满足时执行某特定的动作,如阻止请求或转发至某特定的后端。定义ACL的语法格式如下。 

      acl<aclname> <criterion> [flags] [operator] <value> ... 

  •  <aclname>ACL名称,区分字符大小写,且其只能包含大小写字母、数字、-(连接线)_(下划线).(点号):(冒号)haproxy中,acl可以重名,这可以把多个测试条件定义为一个共同的acl

  •  <criterion>:测试标准,即对什么信息发起测试;测试方式可以由[flags]指定的标志进行调整;而有些测试标准也可以需要为其在<value>之前指定一个操作符[operator]

  •  [flags]:目前haproxyacl支持的标志位有3个:

       -i:不区分<value>中模式字符的大小写;

       -f:从指定的文件中加载模式;

       --:标志符的强制结束标记,在模式中的字符串像标记符时使用;

  •  <value>acl测试条件支持的值有以下四类:

        整数或整数范围:如1024:65535表示从102465535;仅支持使用正整数(如果出现类似小数的标识,其为通常为版本测试),且支持使用的操作符有5个,分别为eqgegtlelt

        字符串:支持使用“-i”以忽略字符大小写,支持使用“\”进行转义;如果在模式首部出现了-i,可以在其之前使用“--”标志位;

        正则表达式:其机制类同字符串匹配;

       IP地址及网络地址

     

  • 同一个acl中可以指定多个测试条件,这些测试条件需要由逻辑操作符指定其关系。条件间的组合测试关系有三种:“与”(默认即为与操作)、“或”(使用“||”操作符)以及“非”(使用“!”操作符)

 

常用的测试标准(criteria)

 

    be_sess_rate <integer>

    be_sess_rate(backend) <integer>

  • 用于测试指定的backend上会话创建的速率(即每秒创建的会话数)是否满足指定的条件;常用于在指定backend上的会话速率过高时将用户请求转发至另外的backend,或用于阻止***行为。例如: 

       backend dynamic

           mode http

           acl being_scanned be_sess_rate gt 50

           redirect location /error_pages/denied.html if being_scanned

 

    fe_sess_rate <integer>

    fe_sess_rate(frontend) <integer>

  • 用于测试指定的frontend(或当前frontend)上的会话创建速率是否满足指定的条件;常用于为frontend指定一个合理的会话创建速率的上限以防止服务被滥用。例如下面的例子限定入站邮件速率不能大于50/秒,所有在此指定范围之外的请求都将被延时50毫秒。

       frontend mail

           bind :25

           mode tcp

           maxconn 500

           acl too_fast fe_sess_rate ge 500

           tcp-request inspect-delay 50ms

           tcp-request content accept if ! too_fast

           tcp-request content accept if WAIT_END

 

    hdr <string>

    hdr(header) <string>

  • 用于测试请求报文中的所有首部或指定首部是否满足指定的条件;指定首部时,其名称不区分大小写,且在括号“()”中不能有任何多余的空白字符。测试服务器端的响应报文时可以使用shdr()。例如下面的例子用于测试首部Connection的值是否为close 

       hdr(Connection) -i close

 

    method <string>

  •  测试HTTP请求报文中使用的方法。

 

    path_beg <string>

  • URLscheme://host:port/path/to/somewhere 中的 /path/to/somewhere 

  • 用于测试请求的URL是否以<string>指定的模式开头。下面的例子用于测试URL是否以/static/p_w_picpaths/javascript/stylesheets头。 

  • acl url_static       path_beg       -i /static /p_w_picpaths /javascript/stylesheets

 

    path_end <string>

  • 用于测试请求的URL是否以<string>指定的模式结尾。例如,下面的例子用户测试URL是否以jpggifpngcssjs结尾。

  • acl url_static       path_end       -i .jpg .gif .png .css .js

 

    hdr_beg <string>

  • 用于测试请求报文的指定首部的开头部分是否符合<string>指定的模式。例如,下面的例子用记测试请求是否为提供静态内容的主机imgvideodownloadftp

  • acl host_static hdr_beg(host) -i img. video. download. ftp.

 

    hdr_end <string>

 

  • 用于测试请求报文的指定首部的结尾部分是否符合<string>指定的模式

 

其它的creterion

  dst_port,src_port, src, dst, url_beg, url_end




利用Haproxy 实现负载均衡


架构图

wKioL1ZiUDvBgXBxAABWoqPqw1c209.png


环境说明

全部基于Centos 6.5

负载均衡器: HA1 IP:192.168.61.143

后端WEB服务器:web1 IP:192.168.61.144 安装apache

         web2 IP:192.168.61.145 安装apache



1.web1 与 web2 服务器配置

安装apache

yum -y install httpd


提供首页文件

web1的:echo "144" > /var/www/html/index.html

web2的:echo "145" > /var/www/html/index.html


启动服务

service httpd start


2.haproxy服务器配置

  安装

    yum -y install haproxy


  简单修改配置文件

    vim /etc/haproxy/haproxy.cfg

    

    global

        log         127.0.0.1 local2

        chroot      /var/lib/haproxy

        pidfile     /var/run/haproxy.pid

        maxconn     4000

        user        haproxy

        group       haproxy

        daemon

    

    stats socket /var/lib/haproxy/stats

    

    defaults

        mode                    http

        log                     global

        option                  httplog

        option                  dontlognull

        option http-server-close

        option forwardfor       except 127.0.0.0/8

        option                  redispatch

        retries                 3

        timeout http-request    10s

        timeout queue           1m

        timeout connect         10s

        timeout client          1m

        timeout server          1m

        timeout http-keep-alive 10s

        timeout check           10s

        maxconn                 3000


    frontend  main *:80 #监听地址与端口

    default_backend             mybackend #指定默认后端服务器组

    

    backend mybackend #后端服务器组设定

        balance     roundrobin

        server  app1 192.168.61.144:80 check

        server  app1 192.168.61.145:80 check

    

  启动服务

    service haproxy start


3.测试

访问http://192.168.61.143/index.html 不断刷新即可轮流显示144与145的网页内容