WEB Firewall

WEB Firewall

iptables firewall

  1. iptables是用户空间命令行程序,它面向系统管理员,用于向内核Linux2.4.x或更高版本的内核传递过滤规则集,而过滤规则是由不同的Netfilter模块实现的。由于网络地址转换也是从数据包过滤规则集配置的,所以网络地址转换也可以使用iptables。。iptables的继承者是nftables,其在内核版本3.13中首次出现。

  2. iptables在网络防护时用于检查、修改、转发、重定向或丢弃IP数据包。过滤IP数据包的代码已经内置到Linux内核中,并被组织成表,每个表都有特定的用途。这些表由预定义链组成,链则包含按顺序遍历的规则。每个规则都包含匹配条件和相应的操作,称之为目标,如果条件为真,则执行,即条件匹配。

  3. iptables是用户空间程序,允许用户使用这些链或规则。大多数新用户认为Linux IP路由非常复杂,但实际上最常见的用例NAT或基本的Internet防火墙要更复杂一些。理解iptables如何工作的关键在于理解其规则的执行流程。大写是链、小写是表

    **************************************** 结构 ****************************************
    Network ------> PREROUTING ---------> Raw --------> Mangle ---------> nat ----------┓
    	┏-------------------------------------------------------------------------------┛
    Routing decision ----> FORWARD ----> Mangle ----> Filter ----> Security ------------┓
    	|																				|
    INPUT ----> Magle ----> Filter ----> Security ----> PROCESS ----> Local-┓			|
    																Routing decision	|
    Security <---- Filter <---- Nat <---- Mangle <---- Raw <---- OUTPUT-----┛			|
    	┗-------------------------------------------------------------------┓			|
    Network <------ Nat <------ Mangle <------- POSTROUTING <------ Routing decision ---┛
    
    *************************************** Table ***************************************
    Raw				具有精准的标记功能,其唯一目的是提供一种标记数据包的机制,以便选择退出连接跟踪。
    Filter			默认使用的表,是广泛使用的表之一。该表用于决定是否让数据包继续到达预期目的地或拒绝其请求。
    Nat				用于实现网络地址转换规则。
    Mangle			用于以各种方式来更改数据包的IP标头。
    Security		用于在数据包上设置内部SELinux安全上下文的标记,这将决定SELinux安全上下文的系统该如何处理数据包。
    
    **************************************** Chain ****************************************
    默认情况下,链不包含任何规则。用户可以将规则附加到要使用的链上。链也有一个默认的策略,它通常被设定为ACCEPT,但其可以重置DROP,默认策略始终适用于链的末尾。因此,在应用默认策略之前,数据包必须通过链中的所有规则,用户定义可以添加链以使规则集更有效或更容易修改。
    
    *********************************** Connection status *********************************
    * 连接跟踪和系统跟踪的连接将处于以下状态之一
    NEW				当用户数据包到达服务端时与现有连接无关,但当第一个数据包无效时,将使用此标签向系统添加新连接。
    ESTABLISHED		当一个连接从NEW改变到ESTABLISHED时,它是在相反的方向上接收有效响应。
    RELATED			标记了不属于现有连接但与系统中已存在的连接关联的数据包RELATED。
    INVALID			如果数据包与现有连接无关,则不适合打开新连接。
    UNTRACKED		可以将数据包标记为UNTRACKED,就像它们已成为raw表链中的目标,用以绕过跟踪。
    SNAT			NAT更改源地址时设置的虚拟状态。由连接跟踪系统使用,以便知道在回复数据包中更改源地址。
    DNAT			目的网络地址转换(DNAT)是一种用于透明地更改最终路由数据包的目的IP地址。
    
  4. 数据包过滤基于iptables规则,该规则由多个匹配条件和一个目标指定。规则可能匹配的典型事项是数据包所在接口类型的数据包或数据包的目标端口。

    # 从iptables迁移到nftables
    
    ## 允许新的请求连接本机tcp 22端口,翻译成nftables的语法
    iptables-translate -A INPUT -p tcp --dport 22 -m conntrack --ctstate NEW -j ACCEPT
    nft add rule ip filter INPUT tcp dport 22 ct state new counter accept
    ## 允许内网IP使用udp协议,且端口是111和222时才能通信 
    ip6tables-translate -A FORWARD -i eth0 -o eth3 -p udp -m multiport –dports 111,222 -j ACCEPT
    nft add rule ip6 filter FORWARD iifname eth0 oifname eth3 meta l4proto udp udp dport {111,222} counter accept
    ## 一次翻译
    iptables-save > save.txt               						# 将iptables规则重定向到save.txt文件中	
    iptables-restore-translate -f save.txt > ruleset.nft		# 一次翻译上述规则,译成nftables的规则并重定向给nftables
    nft -f ruleset.nft                         					# 从文件加载规则
    nft list ruleset                               				# 查看nftables规则列表
    
    # iptables语法
    iptables [-t table] {-A|-C|-D} chain rule-specification
    ip6tables [-t table] {-A|-C|-D} chain rule-specification
    iptables [-t table] -I chain [rulenum] rule-specification
    iptables [-t table] -R chain rulenum rule-specification
    iptables [-t table] -D chain rulenum
    iptables [-t table] -S [chain [rulenum]]
    iptables [-t table] {-F|-L|-Z} [chain [rulenum]] [options...]
    iptables [-t table] -N chain
    iptables [-t table] -X [chain]
    iptables [-t table] -P chain target
    iptables [-t table] -E old-chain-name new-chain-name
    rule-specification = [matches...] [target]  
    match = -m matchname [per-match-options]
    target = -j targetname [per-target-options]
    	-A,--append chain rule-specification					# 将一个或多个规则附加到所选链的末尾。当源和/或目标名称解析为多个地址时,将为每个可能的地址组合添加规则。
    	-C,--check chain rule-specification						# 检查所选链中是否存在与规范匹配的规则。该命令使用与-D相同的逻辑来查找匹配的条目,但不会更改现有的iptables配置,不会使用其退出代码来指示成功或失败。
    	-D,--delete chain rule-specification					# 可以理解为iptables-D INPUT-s1.1.1.1-j DROP。
    	-D,--delete chain rulenum								# 从所选链中删除一个或多个规则。该命令有两个版本:规则可以指定为链中的数字或匹配的规则。例如,iptables-D INPUT1是删除INPUT链的第一条规则。
    	-I,--insert chain[rulenum]rule-specification			# 在所选链中插入一个或多个规则以外给定的规则编号。因此,如果规则编号为1,则将规则插入链的头部;如果未指定规则编号,则是默认值。
    	-R,--replace chain rulenum rule-specification			# 替换所选链中的规则。如果源和/或目标名称解析为多个地址,则命令失败,那么规则从1开始编号。
    	-L,--list[chain]										# 列出所选链中的所有规则。如果未选择链,则列出所有链。像其他iptables命令一样,它适用于指定的表(过滤器是默认值),所以NAT规则由iptables-t nat-n-L列出。请注意它通常与-n选项一起使用,以避免长反向DNS查找。指定-Z(零)选项也是合法的,在这种情况下,链将被原子列出并归零。
    	-S,--list-rules[chain]									# 打印所选链中的所有规则。如果没有选择链,则所有链都像iptables-save一样打印。与其他iptables命令一样,它适用于指定的表(过滤器是默认值)。
    	-F,--flush[chain]										# 刷新选定的链,相当于逐个删除所有规则。
    	-Z,--zero[chain[rulenum]]								# 将所有链中的数据包和字节计数器归零,或仅归零给定链,或仅将链中的给定规则归零。同样指定-L,-list(list)选项是合法的,可以在清除之前立即查看计数器。
    	-N,--new-chain chain									# 按给定名称创建新的用户定义链,不能重复。
    	-X,--delete-chain[chain]								# 删除指定的可选用户定义链时,必须是没有对链的引用。如果有,则必须删除或替换相关规则才能删除链。链必须是空的,即不包含任何规则。如果没有给出参数,将尝试删除表中的每个非内置链。
    	-P,--policy chain target								# 将内置(非用户定义)链的策略设置为给定目标。策略目标必须是ACCEPT或DROP。
    	-E,--rename-chain old-chain new-chain					# 将用户指定的链重命名。
    	-h														# 给出命令语法描述。
    
    # 以下参数构成规则规范:
    	-4,--ipv4												# 该选项对iptables和iptables-restore没有影响。如果使用-4选项的规则插入ip6tables-restore,则该选项将被默认忽略,其他的用途会引发错误。该选项允许将IPv4和IPv6规则放在单个规则文件中,以便与iptables-restore和ip6tables-restore一起使用。
    	-6,--ipv6												# 如果使用-6选项的规则与iptables-restore一起插入,则将被默认忽略,其他用途将会引发错误。该选项允许将IPv4和IPv6规则放在单个规则文件中,以便与iptables-restore和ip6tables-restore一起使用。该选项在ip6tables和ip6tables-restore中无效。
    	[!]-p,--protocol protocol								# 规则或要检查的数据包协议。指定的协议可以是tcp、udp、udplite、icmp、icmpv6、esp、ah、sctp、mh或特殊关键字all之一,也可以是数值,表示这些协议之一或不同的协议,还允许来自/etc/protocols的协议名称。一个“!”协议反转测试前的参数,数字0等于全部。all将与所有协议匹配,并在省略此选项时作为默认值。
    # 注意在ip6tables中,不允许使用除esp之外的IPv6扩展头。esp和ipv6-nonext可以与内核版本2.6.11或更高版本一起使用。数字0等于all意味着用户无法直接测试值为0的协议字段,要匹配HBH表头,即使它是最后一个,也不能使用-p0,但总是需要-m hbh。
    	[!]-s,--source address[/mask][,...]						# 来源规范。地址可以是网络名称、主机名、网络IP地址(带/掩码)或纯IP地址。在将规则提交给内核之前,主机名将仅解析一次。
    # 注意使用远程查询(如DNS)指定要解析的任何名称是一个非常糟糕的主意。掩码可以是ipv4网络掩码(用于iptables)或普通数字,指定网络掩码左侧1的数量。因此,iptables掩码24等于255.255.255.0。一个“!”代表取相反的地址。标志--src是此选项的别名。可以指定多个地址,但这将扩展为多个规则,或者将导致删除多个规则。
    	[!]-d,--destination address[/mask][,...]				# 目的地规格。有关语法的详细说明,请参阅-s(source)标志的说明。标志--dst是此选项的别名。
    	-m,--match match										# 指定要使用的匹配项,即测试特定属性的扩展模块。匹配集构成了调用目标的条件。首先按照命令行中的指定评估匹配并以短路方式工作,即如果一个扩展产生错误,则评估将停止。
    	-j,--jump target										# 指定规则的目标,即如果数据包匹配该怎么办。目标可以是用户定义的链(不是此规则所在的链),是立即决定数据包命运的特殊内置目标之一或扩展。
    	-g,--goto chain											# -g选项将规则重定向到一个用户自定义的链中,与-j选项不同,从自定义链中返回时是返回到调用-g选项上层的那一个-j链中。
    	[!]-i,--in-interface name								# 接收仅适用于进入INPUT、FORWARD和PREROUTING链的数据包的接口名称。当“!”在接口名称之前使用参数,意义是反转的。如果接口名称以“+”结尾,则以--in-interface name名称开头的任何接口都将匹配。如果省略-i选项,则任何接口名称都将匹配。
    	[!]-o,--out-interface name								# 将通过其发送对于进入FORWARD、OUTPUT和POSTROUTING链的数据包的接口名称。当“!”在接口名称之前使用参数,意义是反转的。如果接口名称以“+”结尾,则以此名称开头的任何接口都将匹配。如果省略-o选项,则任何接口名称都将匹配。
    	[!]-f,--fragment										# 该规则仅引用分段数据包的第二个和更多IPv4分段。由于无法告知源端口或目标端口这样的数据包或ICMP类型,因此这样的数据包将不匹配任何指定它们的规则。当“!”参数在“-f”标志之前的时候,规则将仅匹配头部片段或未分段的数据包。此选项是特定于IPv4的,在ip6tables中不可用。
    	-c,--set-counters packets bytes							# 使管理员在INSERT、APPEND和REPLACE操作期间能够初始化规则的数据包和字节计数器。
    	-v,--verbose											# 详细的输出。此选项使list命令显示接口名称、规则选项和TOS掩码。还列出了数据包和字节计数器,后缀为K、M或G,分别表示1000、1000000和1000000000个乘数。当附加、插入、删除和替换规则时会打印规则的详细信息。-v可以多次指定,以便可能发出更详细的调试语句。例如:iptables -I INPUT -s 1.1.1.1 -j DROP -v DROP  all opt -- in * out *  1.1.1.1  -> 0.0.0.0/0  
    	-w,--wait[seconds]										# 等待xtables锁定。为了防止程序的多个实例同时运行,将尝试在启动时获得独占锁。默认情况下,如果无法获取锁定,则程序将退出。此选项将使程序等待,直到可以获得独占锁定。
    	-W,--wait-interval microseconds							# 每次迭代等待的间隔。在运行延迟敏感的应用程序时,等待xtables锁定延长的持续时间可能是不可接受的。此选项将使得每次迭代花费指定的时间量,默认间隔为1s。此选项仅与-w一起使用。
    	-n,--numeric											# 数字输出。IP地址和端口号将以数字格式打印。默认情况下,程序将尝试将它们显示为主机名、网络名称或服务。
    	-x,--exact												# 扩大数字。显示数据包和字节计数器的确切值,而不是仅显示K的舍入数(1000的倍数)M(1000K的倍数)或G(1000M的倍数)。此选项仅与-L命令相关。
    	[!]--fragment-f											# 仅匹配第二个或更多片段。
    	--set-counters PKTS BYTES								# 在插入/追加期间设置计数器。
    	--line-numbers											# 当列出规则时,将行号添加到每个规则的开头,对应于该规则在链中的位置。
    	--modprobe=command										# 在链中添加或插入规则时,可以使用命令加载任何必要的模块,如目标、匹配扩展等。
    	
    # 显示当前规则
    iptables -vnL
    
    # 重置规则
    iptables -F                                            		# 清空filter表
    iptables -X                                            		# 清空用户自定义的链
    iptables -t nat -F                                			# 清空nat表
    iptables -t nat -X                                			# 清空自定义的链
    iptables -t mangle -F                          				# 清空mangle表
    iptables -t mangle -X                          				# 清空自定义的链
    iptables -t raw -F                							# 清空raw表
    iptables -t raw -X                               			# 清空自定义的链
    iptables -t security -F                          			# 清空security表
    iptables -t security -X                          			# 清空自定义的链
    iptables -P INPUT ACCEPT                         			# 设置filter表的INPUT链默认都允许
    iptables -P FORWARD ACCEPT                   				# 设置filter表的FORWARD链默认都允许
    iptables -P OUTPUT ACCEPT                         			# 设置出去的数据包默认都允许
     
     # 编辑规则
    iptables -A INPUT -s 1.1.1.1 -j DROP                     	# 按顺序添加
    iptables -I INPUT -s 1.1.1.2 -j DROP                		# 插入到第一行
    iptables -vnL --line-number        							# 按序号显示filter表规则
    
    # 保存和恢复规则
    iptables-save > /etc/iptables/iptables.rules
    iptables-restore < /etc/iptables/iptables.rules
    

网络层的安全与防御

  1. TCP/IP协议定义了一个在因特网上传输的包,称为IP数据包(IP Datagram)。IPv4是Internet协议开发中的第4个版本,它可以路由Internet上的大多数流量。IPv4标头包括13个必填字段,最小20个字节。

    1. Internet协议支持网络之间的流量,该设计适应不同物理性质的网络,它是独立于链路层中使用的基础传输技术。网络想要将数据包传输到具有较小传输单元的网络时,它可能会分割其数据包。该功能被放置在互联网层,并且在IPv4路由器中执行。IPv6禁止中间节点设备对数据包进行分段发送,分段只能端到端地进行。

    2. 碎片:当路由器收到数据包时,它会检查目标地址并确定要使用的传输接口和该接口的传输单元。如果数据包大小大于传输单元,并且数据包标头中的Do not Fragment位设置为0,则路由器可能会对数据包进行分段。路由器将数据包分成片段,每个片段的最大值是传输单元减去IP头大小(最少20个字节,最多60个字节)。路由器将每个片段放入自己的数据包中,每个片段数据包都有以下变化:总长度字段是片段尺寸;所述多个片段标志被设置为1,除了最后一个,其被设置为0的所有片段;在分段偏移字段被设定的基础上有效载荷片段的偏移量,这是以8字节块为单位测量的;标头校验字段被重新计算。

    3. 重新组装:至少满足下列条件之一,接收方才能知道数据包是片段:设置“更多片段”标志,对于除最后一个片段之外的所有片段都是如此;“片段偏移”字段非零,对于除第一个碎片之外的所有碎片都是如此。

    4. 接收器使用外部和本地地址,以及协议ID和标识字段识别匹配的片段。接收器使用片段偏移和更多片段标志重新组装具有相同ID片段中的数据。当接收器接收到最后一个片段时,它可以通过将最后片段的偏移量乘以8来计算原始数据有效载荷的长度,并添加最后片段的数据大小。当接收器收到所有片段时,可以使用偏移正确地对它们进行排序,并重新组装以产生原始数据段。

  2. IPv6数据包是最小的消息实体,通过因特网协议跨越交换互联网协议版本6(IPv6)的网络。数据包用于查询地址和路由的控制信息,以及由用户数据组成的有效负载。IPv6数据包中的控制信息被细分为强制性固定标头和可选扩展标头。

    1. IPv6分组的有效载荷通常是数据包或更高级别的传输层协议,可以用数据互联网层或链路层来代替。IPv6分组通常通过链路层协议传输,例如以太网,将每个分组封装在每帧中,但这也可以是更高层的隧道协议,如使用6to4或Teredo转换技术时的IPv4。

    2. 路由器不会像对IPv4一样对IPv6数据包进行分段。节点可以使用IPv6Fragment标头在发起源处对数据包进行分段,并将其重新组合在目的地。

      LableOccupied and Describe
      Version6 Version Number
      Traffic Class(6+2bits)字段的bit具有2个值,6个最高有效bits区分服务(DS)保留字段,用于对数据包进行分类。目前,所有标准(DS)字段都以0bit结尾,任何以1bit结尾的(DS)字段都用于本地或实验用途,其余2bit用于显式拥塞通知:源提供拥塞控制的流量和非拥塞控制流量。
      Flow Label最初用于提供实时应用程序的特殊服务。当设置为非0值时,它用作多个出站路径的路由器和交换机的提示,这些路径应保持在同一路径上,以便它们不会被重新排序。建议将流标签用于帮助检测欺骗包。
      Payload Length8位字节中有效负载的大小,包括任何扩展标头。当扩展头携带Jumbo Payload选项时,长度设置为0。
      Next Header指定下一个标头的类型。此字段通常指定传输层由一个数据包的有效载荷使用的协议。当分组中存在扩展标头时,该字段指示跟随扩展标头。这些值与用于IPv4协议字段的值共享,因为两个字段具有相同的功能。
      Hop Limit替换IPv4的生存时间字段。该值在每个转发节点处递减1,若它变为0,则丢弃该分组。即使跳跃限制变为0,目标节点也应该正常处理该分组。
      Source Address发送节点的IPv6地址。
      Destination Address目标节点的IPv6地址。
  3. 传输控制协议接受来自数据流的数据,将其划分为块,并添加TCP头以创建TCP段;然后将TCP段封装到因特网的协议数据包中,并对等交换。术语TCP分组在非正式和正式使用中出现,而在更精确的术语中,段指的是TCP协议的数据单元,简称PDU。TCP将来自缓冲区的数据打包成段并调用因特网模块,以将每个段发送到目的地。

    1. TCP段由段头和数据段组成。TCP标头包含10个必填字段和一个可选的扩展字段。数据部分跟在标题之后,其内容为应用程序携带的有效载荷数据。TCP段头中未指定数据部分的长度,它可以通过从总IP数据报长度中减去TCP标头和封装IP标头的组合长度来计算。
    2. 当主机A发送FIN、主机B回复FIN和ACK、主机A回复ACK时,也可以通过3次握手来终止连接。某些主机TCP堆栈可能实现半双工关闭序列,如Linux或HP-UX。如果这样的主机主动关闭连接,但仍未读取堆栈已从链路接收的所有传入数据,则该主机发送的是RST而不是FIN。这使得TCP应用程序能确保远程应用程序已经读取了前者发送的所有数据,它主动关闭连接时,从远程端等待FIN。远程TCP堆栈无法区分连接中止RST和数据丢失RST,所以两者都会导致远程堆栈丢失所有收到的数据。一些使用TCP打开或者关闭握手进行应用的程序协议,在打开或者关闭握手的应用程序协议时可能会发现RST问题。
    3. 大多数系统实现会在表中分配一个条目,该表将TCP会话映射到正在运行的操作系统进程上。由于TCP数据包不包含会话标识符,因此两个端点都使用客户端的地址和端口来标识会话。每当收到数据包时,TCP实现必须在此表上执行查找,以寻找目标进程。表中的每个条目称为传输控制块或TCB,它包含有关端点、连接状态、正在交换的数据包的运行数据及用于发送和接收数据的缓冲区的信息。
    4. 服务器端的会话数仅受内存限制,并且可以随着新连接的到达而增长,但客户端必须在将第一个SYN发送到服务器之前,分配随机端口。此端口在整个会话期间将保持分配状态,并有效地限制来自每个客户端IP地址的传出连接数。
    5. 如果应用程序无法正确关闭不需要的连接,则客户端可能会耗尽资源并无法建立新的TCP连接。即使是来自其他应用程序也是如此,两个端点还必须为未确认的数据包和已接收但未读取的数据分配空间。
    6. 有一些关键功能可以将TCP与用户数据报协议区分开,比如以下几点:有序数据传输是目标主机根据序列号重新排列;丢失数据包的重传是任何未确认的累积流都会被重新传输;·无差错数据传输;流量控制是限制发送方传输数据的速率,以保证可靠的传输。接收器不断地向发送者暗示可以接收多少数据(由滑动窗口控制)。当接收主机的缓冲区填满时,下一个确认在窗口大小中包含0,以停止传输并允许处理缓冲区中的数据;拥塞控制。
      1. Reliable Transmission(可靠的传输):TCP使用序列号来标识数据的每个字节。序列号标识从每台计算机上发送的字节顺序,以便可以按顺序重建数据,而任何分组重新排序或在传输期间都有可能发生分组丢失的情况。发送器若为第一个数据包,那么就选择第一个字节的序列号,标记为SYN。TCP使用两种主要技术来识别丢失:重传超时(缩写为RTO)和重复的累积确认(DupAcks)。
      2. Dupack-based Retransmission(基于Dupack的重传):如果流中的单个分组(即分组100)丢失,则接收器不能确认高于100的分组,因为它是使用累积的Ack。因此,接收器在接收到另外一个数据分组时,会再次确认分组99,该重复确认用作丢包信号。
      3. Timeout-based Retransmission(基于超时的重传):无论何时发送数据包,发送方都会设置一个计时器,该计时器是对该数据包何时被确认的保守估计。如果发送者在那时没有收到确认,则它将再次发送该数据包。每次当发送者收到确认时,计时器都会重置。这意味着仅当发送方长时间未收到确认时,重新发送计时器才会触发。
      4. Error Detection(错误检测):序列号允许接收器丢弃重复的数据包,并对重新排序的数据包进行正确地排序。确认允许发送者确定何时重新传输丢失的数据包。TCP校验和是现代标准的弱检查,其具有高误码率的数据链路层可能需要额外的链路纠错/检测功能。
      5. Flow Control(流量控制):TCP使用端到端的流量控制协议来避免发送方发送数据的速度太快,TCP接收器无法可靠地接收和处理数据的情况。在具有不同网络速度的机器进行通信的环境中,具有用于流控制的机制是必不可少的。
      6. Congestion Control(拥塞控制):TCP的最后一个主要功能是拥塞控制。TCP使用多种机制来实现高性能并避免拥塞崩溃的情况,其中网络性能可能会下降几个数量级。
      7. Maximum Segment Size(最大段大小):最大段大小(MSS)是数据,以字节为单位指定的最大数量,即TCP愿意接收单个段。为了获得最佳性能,应将MSS设置得足够小以避免IP分段,这可能会导致数据包丢失和过多的重新传输。
      8. Selective Acknowledgments(选择性确认):若纯粹依赖原始TCP协议采用的累积确认方案,则可能导致数据包丢失时效率低下的情况。duplicate-SACK选项是2000年5月在RFC2883中定义的SACK选项的扩展,因此解决了这个问题。
      9. Window Scaling(窗口缩放):为了更有效地使用高带宽网络,可以使用更大的TCP窗口。TCP窗口大小字段控制数据流,其值限制在2~65535字节之间。
      10. TCP Timestamps(TCP时间戳):RFC1323中定义的TCP时间戳可以帮助TCP确定数据包的发送顺序。
      11. Out-of-band Data(带外数据):带外数据可以中断或中止排队的流,而不是等待流完成,这是将数据指定为紧急来完成的,用于告诉接收程序立即处理它及其他紧急数据。完成后,TCP要通知应用程序并恢复到流队列。
      12. Forcing data Delivery(强制数据交付):通常,TCP会等待200毫秒以便发送完整的数据包。如果在文件传输期间不断重复,则此等待会产生很小但可能会很严重的延迟。
  4. 通过iptables的LOG目标和抓包工具都可以记录IP标头信息。

    tshark -i eth0 -n -f 'icmp and src 192.168.18.40'			# 在服务端抓包来自192.168.18.40的请求
    iptables -A INPUT -j LOG --log-ip-options --log-tcp-sequence --log-tcp-options --log-uid --log-macdecode
    															# 记录标头信息
        --log-level level										# 记录级别(数字或参见syslog.conf)
        --log-prefix prefix										# 使用此前缀添加前缀日志消息
        --log-tcp-sequence										# 记录TCP序列号
        --log-tcp-options										# 记录TCP选项
        --log-ip-options										# 记录IP选项
        --log-uid												# 记录拥有本地套接字的UID
        --log-macdecode											# 解码MAC地址和协议
    
  5. 网络层攻击即通过发送网络层标头字段的一个或一系列数据包,利用TCP/IP实现中的漏洞,消耗网络层资源或隐藏针对更高层协议的攻击。网络层攻击是指利用基本网络协议进行攻击以获得任何有用的攻击。这些攻击通常涉及欺骗网络地址,以便计算机将数据发送给入侵者,但不是其正确的接收者或目的地。其他攻击可能涉及通过拒绝服务(DoS)攻击而造成的服务中断,是一种蛮力的方法。

  6. 当检测到攻击来自某个特定的IP时,可以使用iptables进行回应拦截。比如在INPUT、OUTPUT、FORWARD链中匹配拦截(可以是某个协议、端口或者IP)

    iptables -I INPUT -s 192.168.18.40 -j DROP 					# 禁止此IP进来
    iptables -I OUTPUT -d 192.168.18.40 -j DROP 				# 禁止数据通向此IP
    iptables -I INPUT -p icmp -j DROP       					# 最安全的是直接禁ping
    iptables -I INPUT -s 192.168.18.40 -p icmp -j DROP			# 只禁止此IP ping 
    iptables -I INPUT -s 192.168.18.40 -m limit --limit 10/s --limit-burst 10 -j ACCEPT                                  
    															# 进行限速每秒10个包
    

传输层的安全与防御

  1. 其实,传输层的标头信息记录方式和网络层的记录方式异曲同工,不同的是协议由ICMP换成了TCP和UDP。

    iptables -P INPUT ACCEPT      								# 默认放行所有的数据包
    iptables -F                      							# 清空之前的filter表
    iptables -A INPUT -s 192.168.18.40 -p tcp -j LOG --log-ip-options --log-tcp-sequence --log-tcp-options --log-uid --log-macdecode
                                                                # 只记录192.168.18.40 的TCP数据包
    nc -v 192.168.18.22 2288  									# 检测TCP协议端口2288是否连通
    tail -f /var/log/messages									# 实时查看日志
    tshark -i eth0 -n -f 'tcp port 2288 and host 192.168.18.40 '# 抓取来自192.168.18.40请求的本地TCP协议端口为2288的服务
    
    iptables -D INPUT 1											# 因为就一条规则,所以数字1代表TCP记录的规则
    iptables -F                   								# 直接清空filter等同删除所有的规则
    iptables -A INPUT -s 192.168.18.40 -p udp -j LOG --log-ip-options --log-tcp-sequence --log-tcp-options --log-uid --log-macdecode
    															# 记录UDP数据包
    nc -v -u 192.168.18.22 111             						# -u代表udp模式
    tshark -i eth0 -n -f 'udp port 111 and host 192.168.18.40'	# 抓取来自192.168.18.40访问本机UDP端口111的通信
    
    
    
  2. UDP是一个简单的面向消息的传输层协议。虽然UDP提供了标头和有效载荷的完整性验证,但它不保证上层协议的消息传递,UDP层一旦发送就不保留UDP消息的状态。因此,UDP有时被称为不可靠数据包协议。

  3. 存在即合理,下面列举几个UDP的属性优势。面向事务,适用于简单的查询响应协议;提供数据包,适用于建模的其他协议;适用于没有完整协议栈的引导或其他目的;无状态,适用于大量客户端;缺乏重传延迟特征,使得UDP适合于实时应用;支持多播,所以UDP适用于诸如精确时间协议和路由信息协议之类的多种服务发现和共享信息之类的广播信息。

  4. 传输层攻击的定义与网络层攻击的定义一样,通过发送网络层标头字段的一个或一系列数据包,以达到利用TCP/IP实现中的漏洞,消耗网络层资源的行为。传输层攻击类型有如欺骗;利用网络栈漏洞;拒绝服务;信息收集.

  5. 传输层的攻击方式多种多样,本节将会列出已知的传输层攻击类型,最后将演示部分攻击示例,如TCP洪水攻击和UDP洪水攻击。

  6. TCP可能会以各种方式受到攻击,具体有以下几种:

    1. 拒绝服务:通过使用欺骗性的IP地址并重复发送特意组装的SYN数据包,然后发送许多ACK数据包,攻击者可以使服务器消耗大量资源以跟踪虚假连接,这被称为SYN泛洪攻击。

      hping3 -I eth0 --rand-source -S 192.168.18.22 -p 80 –i u1000
      														# 发起syn洪水攻击,频率为1微秒,且源地址是随机生成的
      sysctl -w net.ipv4.tcp_syncookies=0        				# 关闭SYN防御
      netstat -nat |awk '{print $6}'|sort|uniq -c|sort –rn	# 统计并查看连接状态
      netstat -tna|more     									# 查看连接 
      
    2. 连接劫持:连接劫持能够窃听TCP会话并重定向数据包的攻击,攻击者从正在进行的通信中学习序列号,并伪造一个看起来像流量中下一段的错误段,这种简单的劫持可能会导致一端错误地接收一个数据包。当接收主机向连接的另一侧确认额外的段时,同步连接将丢失。

    3. TCP否决:TCP否决能够窃听并预测要发送的下一个数据包大小的攻击,可以使接收者接受恶意的有效载荷,而且不会中断现有连接。

    4. TCP重置攻击:TCP重置攻击也称为伪造TCP重置,是通过发送伪造的TCP重置数据包来篡改和中断Internet连接的一种方法。这种篡改技术可以被善意的防火墙使用或者被恶意攻击者滥用来中断网络连接。

  7. UDP攻击者通过向目标主机发送大量的UDP报文,使目标主机忙于处理这些UDP报文,从而无法处理正常的报文请求。使用UDP进行拒绝服务攻击并不像传输控制协议那样简单,但是可以通过向远程主机上的随机端口发送大量UDP数据包来启动UDP泛洪攻击。被攻击端将:检查端口监听的应用程序;看到没有应用程序监听端口;回复ICMP Destination Unreachable数据包。

  8. 因此,对于大量UDP数据包,受害系统将被强制发送许多ICMP数据包,最终会导致其他客户端无法访问。攻击者还可以欺骗UDP数据包的IP地址,确保过多的ICMP返回数据包不会返回给真正的攻击者,而是返回给伪造的IP地址,并匿名化其网络位置。

  9. 大多数操作系统可通过限制ICMP响应的发送速率来缓解这部分攻击,如下:

    hping3 -I eth0 -i u1000 --flood -2 --rand-source –k 192.168.18.15 -p 111
    															# 客户端发起UDP模式,洪水攻击目标为192.168.18.15,端口为111 且频率为1微秒
    tshark -i eth0 -n -f 'udp port 111 or icmp'					# 服务端抓取UDP端口111和icmp协议通信
    
  10. 在某些情况下,传输可以针对通信发出回应。防火墙或其他过滤设备可以基于传输层标头实现过滤操作(具体详见第1章中的firewall.sh脚本),然后制造RST或ACK数据包以中断TCP连接,或者可以限制数据包的传输速率,所以暴露的端口越少越安全。

    sysctl -w net.ipv4.tcp_syncookies=1   						# 打开syncookies防御syn攻击
    echo "kkk" |nc -u 192.168.18.22 113							# 用nc工具向192.168.18.22 udp端口113发起通信
    tshark -i eth0 -n -f 'udp port 113 or icmp'					# 抓取eth0网卡udp端口113和icmp协议通信
    
    iptables -I INPUT -p udp --dport 113 -j REJECT --reject-with icmp-port-unreachable
    															# 服务端在iptables添加UDP端口111返回值为端口无法访问
    nc -l -u -p 113 &                   						# nc 监听UDP端口为113
    netstat -tupln|grep 113       								# 确认是否正常监听
    echo "kkk" |nc -u 192.168.18.22 113 						# 向服务端发送字符串
    tshark -i eth0 -n -f 'udp port 113 or icmp'					# 抓取eth0网卡UDP端口113的通信
    iptables -I OUTPUT -p icmp -j DROP							# 比较简单的作法是不回应ICMP消息
    
    # ICMP 目标无法访问分多种情形,如iptables --reject-with type 有以下几种选项,可根据相应情况选择不同的参数响应。
    static const struct reject_names_xlate reject_table_xlate[] = {
        {"net-unreachable",      IPT_ICMP_NET_UNREACHABLE},     /* 网络无法访问*/
        {"host-unreachable",      IPT_ICMP_HOST_UNREACHABLE},   /* 主机无法访问*/
        {"prot-unreachable",      IPT_ICMP_PROT_UNREACHABLE},   /* 协议无法访问*/
        {"port-unreachable",      IPT_ICMP_PORT_UNREACHABLE},   /* 端口无法访问*/
    #if 0
        {"echo-reply",            IPT_ICMP_ECHOREPLY},          /* 默认没有编译此选项*/
    #endif
        {"net-prohibited",      IPT_ICMP_NET_PROHIBITED},       /* 网络禁止*/
        {"host-prohibited",      IPT_ICMP_HOST_PROHIBITED},     /* 主机禁止*/
        {"tcp reset",            IPT_TCP_RESET},                /* 设置RST位 */
        {"admin-prohibited",      IPT_ICMP_ADMIN_PROHIBITED}    /* 管理员禁止 */
    };
    

应用层的安全与防御

  1. 应用层是最高层,是在OSI模型下6层的基础上构建的。随着科技的发展,成千上万的网络应用程序由此出现,它们旨在帮助个人、企业、政府简化工作和解决重复性工作,而应用层也是最易受攻击的目标。

  2. 字符串匹配模块是一个字符串匹配过滤器,可以使用以下-m string选项来拒绝不需要的数据包:

    iptables -m string --help
        --from                       							# 数据包偏移量开始搜索。默认情况下,搜索从偏移量0开始
        --to                         							# 数据包偏移量停止搜索。该选项和前一个选项非常有用,因为我们可以限制在数据包内的搜索,而不是全部过滤,从而节省时间和CPU周期。默认情况下,它将搜索整个数据包,最大限制设置为65535字节,即最大IP数据包长度
        --algo                       							# 要使用的算法有两个,即Boyer-Moore和Knuth-Pratt-Morris,我们一般使用第一个
        [!] --string string         							# 文本搜索模式。注意,--string为单引号时为精确匹配,为双引号时为模糊匹配
        [!] --hex-string string      							# 十六进制格式的搜索模式,模式必须用'|'分隔标志。十六进制字符可以用空格分隔,如'|61626364|'或'|61626364|'
        
    iptables -A INPUT -p tcp --dport 77 -m string --string 'kkk' --algo bm -j DROP
    															# 服务端 iptables添加tcp端口77字符串过滤,当字符串为kkk时断开通信
    iptables -I INPUT -p tcp --dport 77 -m string --string "kkk" --algo bm -j LOG --log-prefix "ok" --log-ip-options
    															# 记录字符串通信到日志
    nc –lvp 77 													# 监听tcp端口77
    
  3. 应用层的攻击可定义为:破坏应用程序或篡改应用程序数据,从而达到某种目的的行为。应用层攻击种类繁多,除钓鱼、后门和缓冲区溢出这种常见的方式以外,更多的是针对Web发起的攻击,这里只列出OWASP的十大攻击类型。

    1. 缓冲区溢出攻击,在信息安全和编程中,缓冲区溢出是一种异常,程序在将数据写入缓冲区时会超出缓冲区的边界并覆盖相邻的存储器位置。

    2. 钓鱼式攻击:网络钓鱼是一种欺诈性尝试,它将自己伪装成可信懒的站点或链接地址,通常通过电子邮件欺骗或即时消息进行欺骗,它通常利用一个与合法网站外观相匹配的虚假网站,诱导用户输入个人信息。

    3. 后门攻击:后门是一种方法,在加密的计算机系统、产品或嵌入式设备中,经常秘密绕过正常的认证,例如作为一部分密码系统、一个算法、一个芯片组或微型计算机。后门通常用于保护对计算机的远程访问或者在加密系统中获得对纯文本的访问。

    4. Web攻击是用户最容易接触的一种攻击类型,而Web攻击又细分了SQL注入、跨站攻击等,这里列出OWASP定义的十大攻击类型,SQL注入;跨站点脚本; 远程文件包含; 本地文件包含; PHP代码注入; Java代码注入; HTTPoxy; Shellshock; UNIX/Windows Shell注入; 会话修复; 脚本/扫描程序/Bot检测; 元数据/错误泄漏。

    5. 应用层DDoS攻击主要用于特定目标,包括中断事务和访问数据库。它需要的资源少于网络层攻击,但通常伴随着它们而进行。攻击可能伪装成看似合法的流量,应用程序层的攻击可能会中断服务。

    6. 应用层防御需要一种自适应策略,包括根据特定规则集限制流量的能力,这些规则可能会定期波动。

  4. 网络嗅探, 连接到可信网络,连接到任何公共网络都有可能遭受嗅探流量的风险。加密发送的所有流量,这将确保即使流量被嗅探,攻击者也无法理解它,这里需要注意的一点是安全工作的深度防御原则。网络扫描和监控,必须扫描网络以方便查找可能以跨区模式设置来捕获流量的任何类型的入侵企图或恶意设备。

Naxsi firewall

  1. Web application firewall is a special type of application firewall,专门应用于Web应用程序。它部署在Web应用程序前,分析基于Web的双向流量,能检测和阻止任何恶意攻击。OWASP作为Web应用程序级别的安全解决方案,为WAF提供了广泛的技术定义。Web防火墙经过三代, 数据包过滤器, 有状态过滤器, 应用层。

  2. WAF被定义为位于Web应用程序和客户端及端点之间的安全策略执行点。该功能可以在软件或硬件中实现,也可以在设备中运行或者在运行公共操作系统的服务器中实现。WAF可以是一个虚拟或物理设备,可以防止Web应用程序中的漏洞被外部威胁利用。产生这些漏洞的原因,可能是因为应用程序本身是遗留类型或者设计编码不充分等因素造成的。而WAF可通过规则集的特殊配置来解决这些代码缺陷,也可以通过渗透测试或漏洞扫描程序发现以前未知的漏洞。除了搜索Web应用程序的漏洞之外,这些工具还会查找软件编码错误,从而解决漏洞,这通常被称为补救。开发者可以在应用程序中对代码进行更正,但通常需要更快速的响应。在这些情况下,可能需要为独特的Web应用程序漏洞应用自定义策略,用以提供临时的修复,这被称为虚拟补丁。

  3. WAF基本上以三种不同的方式部署,部署选项分别是透明网桥、透明反向代理和反向代理。透明是指HTTP流量直接发送到Web应用程序上,因此WAF在客户端和服务器之间是透明的。透明桥接使用转发信息库的表来控制网段之间的帧转发,该表开始为空,并在桥接收帧时添加条目。如果在表中未找到目标地址条目,则该帧将被广播到桥的所有端口,然后将帧广播到除接收它之外的其他段。反向代理是一种代理服务,它代表客户端从代理服务器检索资源,实际上是代理服务器后面的服务器将这些资源返回给客户端。

  4. Naxsi是Nginx Anti XSS和SQL Injection的首字母缩写。从技术上讲,它是第三方Nginx模块,可作为许多类UNIX平台的软件包提供。默认情况下,此模块会读取一小部分的简单规则,其中包含99%的网站漏洞中涉及的已知模式。例如,字符小于号和字符竖“<|”或drop不应该是一个URI的一部分。

  5. 非常简单,这些模式可能与合法查询相匹配,Naxsi的管理员职责是添加特定规则,将合法行为列入白名单。管理员可以通过分析Nginx的错误日志,手动添加白名单或者通过密集的自动学习阶段来启动项目,该阶段将自动生成有关网站行为的白名单规则。

  6. 简而言之,Naxsi的行为类似于DROP-by-default防火墙,其唯一的任务是为目标网站添加所需的ACCEPT规则,使其正常工作。与大多数Web应用程序防火墙相反,Naxsi不依赖于像防病毒一样的签名库,因此无法通过“未知”攻击模式来规避。

  7. Naxsi安装

    # 编译Naxsi,构建依赖项:gcc、make、nginx、libpcre3-dev。下载Naxsi
    git clone https://github.com/nbs-system/naxsi.git					# 下载Naxsi源码
    wget http://nginx.org/download/nginx-1.15.8.tar.gz					# 下载Nginx
    tar zxvf nginx-1.15.8.tar.gz      									# 解压缩
    cd nginx-1.15.8                       								# 进入目录
    ./configure --add-module=../naxsi/naxsi_src 						# 设置编译参数,添加第三方模块,检测编译环境
    make -j4            												# 编译-j4是四核CPU
    make install														# 安装到/usr/local/nginx目录
    
    # 基本配置,假如用户需要启用Naxsi,则需要进行如下的配置之后才可以使其按着用户的意愿工作。而在这里只是介绍最简单的设置以便读者理解,在后续的章节中将会讲解更加高级的用法。
    cat /usr/local/nginx/conf/nginx.conf
    http {
    	include /usr/local/nginx/conf/naxsi_core.rules;					# 加载naxsi规则
    }
    
    # Naxsi基于location工作,这意味着只能在location中启用它,代码如下:
    server {
        location / { 
            SecRulesEnabled;                  							# 启用Naxsi
            LearningMode;                         						# 启用学习模式
            LibInjectionSql;                   							# 启用SQLI libinjection支持
            LibInjectionXss;                   							# 启用XSS libinjection支持
            DeniedUrl "/RequestDenied";       							# 用户被拦截时跳转的页面
            CheckRule "$SQL >= 8" BLOCK;      							# $ SQL分数高于或等于8时要采取的操作
            CheckRule "$RFI >= 8" BLOCK;
            CheckRule "$TRAVERSAL >= 5" BLOCK;
            CheckRule "$UPLOAD >= 5" BLOCK;
            CheckRule "$XSS >= 8" BLOCK;
            proxy_pass http://127.0.0.1;
        }
        location /RequestDenied {
        	return 403;
        }
    }
    
    # 由于Naxsi使用白名单方法,会产生大量误报,丢弃合法请求。为防止出现这种情况,必须编写白名单。例如,有一个销售家具的电子商务网站,人们可能会搜索类似的东西,如带有关键字的table。
    # 不幸的是,table也是一个SQL关键字,它将触发Naxsi。为了防止这种情况,可以写一个白名单告诉naxsi table在搜索表单中允许的关键字(假设搜索表单在/search),代码如下:
    server {
        location / {
            SecRulesEnabled;                   							# 启用Naxsi
            LearningMode;                        						# 启用学习模式
            LibInjectionSql;                        					# 启用SQLI libinjection支持
            LibInjectionXss;                   							# 启用XSS libinjection支持
            DeniedUrl "/RequestDenied";      							# 用户被拦截时跳转的页面
            CheckRule "$SQL >= 8" BLOCK;      							# $ SQL分数高于或等于8时要采取的操作
            CheckRule "$RFI >= 8" BLOCK;
            CheckRule "$TRAVERSAL >= 5" BLOCK;
            CheckRule "$UPLOAD >= 5" BLOCK;
            CheckRule "$XSS >= 8" BLOCK;
            BasicRule wl:1000 "mz:$URL:/search|$ARGS_VAR:q";
            proxy_pass http://127.0.0.1;
            ....
        }
    }
    
    # 还可以使用Naxsi创建黑名单,即使在学习模式下也可以删除请求。假设一个PHP脚本容易受到ID参数中不带引号的SQLI攻击,例如:
    GET /vuln_page.php?id=1'+or+1=1/*
    
    # 也可以使用Naxsi 虚拟修补此漏洞,方法是添加一个黑名单,拒绝每个请求,/vuln_page.php中的id 参数包含除数字之外的任何内容。在此示例中,黑名单仅适用于该“/”位置,也可以使用MainRule 并将其放在http 块中使其全局使用。
    server {
        location / {
            SecRulesEnabled;                        					# 启用Naxsi
            LearningMode;                         						# 启用学习模式
            LibInjectionSql;                   							# 启用SQLI libinjection支持
            LibInjectionXss;                  							# 启用XSS libinjection支持
            DeniedUrl "/RequestDenied";      							# 用户被拦截时跳转的页面
            CheckRule "$SQL >= 8" BLOCK;      							# $ SQL分数高于或等于8时要采取的操作
            CheckRule "$RFI >= 8" BLOCK;
            CheckRule "$TRAVERSAL >= 5" BLOCK;
            CheckRule "$UPLOAD >= 5" BLOCK;
            CheckRule "$XSS >= 8" BLOCK;
            BasicRule id:4242 "mz:$URL:/vuln_page.php|$ARGS_VAR:id" "rx:[^\d]+"
            "s:DROP" "msg:blacklist for SQLI in /vuln_page.php";
            proxy_pass http://127.0.0.1;
            .... 
        }    
    }
    
  8. Naxsi配置指令,指令工作在不同的上下文中,如http、server、location,而在不同的上下文中功能也不同,如局部配置和全局配置。

    1. 白名单

      # 白名单旨在指示Naxsi忽略上下文中的特定模式以避免误报,即允许term在url/search中指定字段中的字符,如下。
      BasicRule wl:1013 "mz:$ARGS_VAR:term|$URL:/search";
      
      # 白名单可以出现在location级别或http级别。白名单的语法。除了wl部分外,所有内容都必须用双引号引用。白名单ID(wl:...):哪些规则的ID列入白名单。白名单ID的语法。
          wl:0:白名单所有规则;
          wl:42:白名单规则#42;
          wl:42,41,43:白名单规则42、41和43;
          wl:-42:将所有用户规则(>=1000)列入白名单,但规则42除外。
      # 注意:不能在白名单中混合使用正面和正面ID。
      
      # MatchZone(mz:...):mz是匹配区域,指定请求的哪个部分必须忽略指定的ID。在白名单的上下文中,必须满足mz中指定的所有条件:
      BasicRule wl:4242 "mz:$ARGS_VAR:foo|$URL:/x";
      
      # 忽略foo仅在URL上命名的GET var中的id4242/x。至于规则,$URL*在匹配区域中不足以指定目标区域。
      # 区域(ARGS、BODY和HEADERS)可以加上后缀|NAME,表示规则在变量名称中匹配,但不与其内容匹配;RAW_BODY白名单与任何的BODY白名单一样,请参阅白名单示例;白名单_X不能与元素_VAR或$URL项目混合。即:
      $URL_X:/foo|$ARGS_VAR:bar : WRONG
      $URL_X:^/foo$|$ARGS_VAR_X:^bar$ : GOOD
      
    2. 规则

      # 规则旨在搜索检测攻击的请求部分模式,即在任何GET或POST参数中,DROP包含字符串'zz'的任何请求:MainRule id:424242"str:zz""mz:ARGS|BODY""s:DROP";规则可以出现在location level(BasicRule)或http level(MainRule)中,规则架构。
      # 除了id部分之外,必须用双引号引用所有的内容。
      # ID(id:...):id:num是规则的唯一数字ID,将在NAXSI_FMT或白名单中使用。ID低于1000为Naxsi内部规则保留的ID(协议不匹配等)。匹配模式可以是正则表达式、字符串匹配或对lib(libinjection)的调用。
          rx:foo|bar:会匹配foo或bar;
          str:foo|bar:会匹配foo|bar;
          d:libinj_xss:如果是libinjection,可与XSS(>=0.55rc2)匹配;
          d:libinj_sql:如果是libinjection,可与SQLi(>=0.55rc2)匹配。
            
      # 建议尽可能使用纯字符串匹配,因为更快。所有字符串必须小写,因为Naxsi的匹配不区分大小写。
      # 分数(s:...):s是得分部分,如图6.5所示。可以创建“命名”计数器:s:$FOOBAR:4,将计数器$FOOBAR的值增加4。
      # 一个规则可以增加几个分数:s:$FOO:4,$BAR:8将增加$FOO4和$BAR8。规则也可以直接指定一个动作,如BLOCK(阻止请求非学习模式)或DROP(即使在学习模式下也阻止请求)命名分数稍后由CheckRules处理。
      # MatchZone(mz:...):mz是匹配区域,用于定义规则将检查请求的哪个部分。在规则中,所有的匹配区$URL*:都被视为OR条件:
      MainRule id:4242 str:z "mz:$ARGS_VAR:X|BODY";
      
      # 模式'z'将在GETvar'X'和所有的BODY变量中搜索:
      MainRule id:4242 str:z "mz:$ARGS_VAR:X|BODY|$URL_X:^/foo";
      
      # 只要URL以/foo开头,就会在GET var'X'和所有BODY变量中搜索模式'z'。
      # 从naxsi0.55rc0开始,对于未知内容类型,可以使用RAW_BODYmatch-zone。RAW_BODY规则如下:
      MainRule id:4241 s:DROP str:RANDOMTHINGS mz:RAW_BODY;
      
      # RAW_BODY区域中的规则仅适用于:在内容类型未知(意味着Naxsi不知道如何正确地解析请求);id11(未知内容类型的内部阻止规则)已列入白名单。
      # 然后,将完整的主体(解码的url并将空字节替换为0)传递给这组规则,完整的主体再次匹配正则表达式或字符串匹配。RAW_BODY规则的白名单实际上就像正常的BODY规则一样,例如:
      BasicRule wl:4241 "mz:$URL:/rata|BODY";
      
    3. CheckRule(匹配动作)指示Naxsi根据累计得分请求最终动作,如LOG(仅记录)、BLOCK(锁定)、DROP(丢弃)和ALLOW(同意)。累计得分通常由一个或多个规则设定。CheckRule必须出现在location级别,匹配动作。

      1. 典型的CheckRule用法:

        CheckRule "$SQL >= 8" BLOCK;
        
      2. 如果$SQL等于或高于8,则将BLOCK标志应用于请求,仅当位置未处于学习模式时才会阻止请求。

      3. CheckRule(s)也可以用来混合白名单和黑名单。配置混合虚拟补丁(参见6.3.2规则)naxsi_core.rules,如下:

        CheckRule "$UWA >= 4" DROP;
        CheckRule "$XSS >= 8" BLOCK;
        
      4. 因此,即使在学习模式中,任何 U W A 得分等于 4 的请求都将阻止请求,而具有 UWA得分等于4的请求都将阻止请求,而具有 UWA得分等于4的请求都将阻止请求,而具有XSS得分的请求将仅在不学习的位置被阻止。

    4. 请求拒绝

      1. DeniedUrl是用户被拦截时跳转的页面。
      2. 在0.49之前的版本中,默认情况下,Naxsi在学习模式下转发阻止请求。在“真实”请求终止后,可使用Nginx的post_action机制。这是由于使用了ngx_http_internal_redirect,它可以拦截实时流量。
      3. 由于在重定向(url和arguments)期间可能会修改请求,因此会添加额外的HTTP标头orig_url、orig_args和naxsi_sig。如果$naxsi_flag_post_action设置为1,即在版本’‘’>0.49’''中,处于学习模式时Naxsi也会执行post_action。
    5. 指令索引

      1. DeniedUrl:别名denied_url,位于location,是用户被拦截时跳转的页面。例如:

        location / {
        ...
        DeniedUrl "/RequestDenied";
        }
        location /RequestDenied {
        return 403; 
        }
        
        LearningMode:别名learning_mode,位于location。LearningMode启用学习模式,例如:
        
        location  /a {
        LearningMode; 
        }
        
      2. 记住,id即使在学习模式下,内部规则也会丢弃请求,因为这意味着有些东西正在进行,Naxsi无法正确处理请求。如果这些都是合理的请求,可以将其加入白名单。

        ·SecRulesEnabled:别名为rules_enabled,位于location,它启用Naxsi的必需关键字。
        
        ·SecRulesDisabled:别名为rules_disabled,位于location,禁用Naxsi。
        
        ·CheckRule:别名为check_rule,位于location,详见6.3.3节介绍。
        
        ·BasicRule:别名为basic_rule,位于location,用于声明规则或白名单的指令。
        
        ·MainRule:别名为main_rule,位于http,用于声明规则或白名单的指令。
        
        ·LibInjectionXss:别名为libinjection_xss,位于location,用于在HTTP请求的所有部分启用libinjection的xss检测。
        
        ·LibInjectionSql:别名为libinjection_sql,位于location,用于在HTTP请求的所有部分启用libinjection的sqli检测。
        
        # naxsi_extensive_log:位于server,可在运行时设置的标志,用于启用Naxsi扩展日志。示例如下:
        server {
         if ($remote_addr = "1.2.3.4") {
          set $naxsi_extensive_log 1;
         }
        location / {
         }
        }
        
        # naxsi_flag_enable:位于server,可在运行时设置启用或禁用Naxsi的标志。示例如下:
        server {
         set $naxsi_flag_enable 1;
         location / {
         }
        }
        
        # naxsi_flag_learning:位于server,可在运行时设置启用或禁用学习的标志。示例如下:
        server {
         set $naxsi_flag_learning 1;
         location / {
         }
        }
        
        # naxsi_flag_libinjection_sql:位于server,可在运行时设置的标志,用于启用或禁用libinjection的sql检测。示例如下:
        server {
         set $naxsi_flag_libinjection_sql 1;
         location / {
         }
        }
        
        # naxsi_flag_libinjection_xss:位于server,可在运行时设置的标志,用于启用或禁用libinjection的xss检测。示例如下:
        server {
         set $naxsi_flag_libinjection_xss 1;
         location / {
         }
        }
        
    6. 匹配规则

      1. Match Zones mz存在于规则和白名单中,它用于指定搜索的位置或允许的位置。注意,匹配规则在黑名单和白名单中的行为略有不同:在黑名单中,每个条件都是OR,而在白名单中是AND。

      2. 匹配参数,全局区域主要存在4个区域:URL、ARGS、HEADERS和BODY。其中,BODY和matchzone可能或多或少具有限制性。matchzone支持匹配的区域及该区域的参数:

        ·ARGS:GET args。
        ·HEADERS:HTTP标头。
        ·BODY:POST args(和RAW_BODY)。
        ·URL:URL本身(在'?'之前)或者更具体。
        ·$ARGS_VAR:string:命名GET参数。
        ·$HEADERS_VAR:string:命名HTTP标头。
        ·$BODY_VAR:string:命名POST参数。
        有时,需要正则表达式(即变量名称可能会有所不同):
        ·$HEADERS_VAR_X:regex:正则表达式匹配命名的HTTP标头(>=0.52)。
        ·$ARGS_VAR_X:regex:正则表达式匹配GET参数的名称(>=0.52)。
        ·$BODY_VAR_X:regex:正则表达式匹配POST参数的名称(>=0.52)。
        匹配区域可以限制为特定的URL:
        ·$URL:string:限于此网址,完全匹配。
        ·$URL_X:regex:用正则表达式匹配字符串,属于模糊匹配(>=0.52)。
        更具体的匹配区域:
        ·FILE_EXT:文件名(在包含文件的多部分POST中);
        ·RAW_BODY:HTTP请求的BODY的原始未解析表示(>=0.55rc0)。
        
      3. 组合匹配,组合匹配是一个或多个区域与可选URL的组合。组合匹配如图6.7所示,在大多数情况下,可以预测变量名和url,并且可以创建静态mz。当需要正则表达式时,正则匹配。注意:不能在规则中混合使用regex( U R L X )和 s t a t i c ( URL_X)和static( URLX)和staticARGS_VAR)。

      4. 白名单,在白名单环境中,必须满足所有的条件:

        BasicRule  wl:1317 "mz:$URL:/news.css|URL";
        
      5. 黑名单,其他条件都被视为OR:

        MainRule "rx:\.ph|\.asp|\.ht" "msg:asp/php file upload" "mz:FILE_EXT" 
        "s:$UPLOAD:8" id:1500;
        
  9. Naxsi基础使用

    1. 本节主要讲解BasicRule是如何生成的,主要用Nxtool工具把日志导入Elasticsearch的内存库中,再进行识别匹配,最后生成BasicRule规则,并介绍一些生成的技巧。

    2. Nxtool是新的学习工具,它将执行以下操作:事件导入:将Naxsi事件导入Elasticsearch数据库;白名单生成:从模板而不是从纯粹的统计方面生成白名单;事件管理:允许将事件标记到数据库中,以将其从wl gen进程中排除;报告:显示当前数据库的内容信息。

    3. 配置文件:nxapi.json,Nxapi使用JSON文件进行设置,例如:

      $ cat nxapi.json
      {
      "elastic" : {
       "host" : "127.0.0.1:9200",  #Elasticsearch监听端口
       "use_ssl" : false,         #不启用ssl加密
       "index" : "nxapi",      #索引
       "number_of_shards" : "4", #分片
       "number_of_replicas" : "0",
       "doctype" : "events",     #文档类型
       "default_ttl" : "7200",      #生存时间
       "max_size" : "1000",     #最大空间
       "version" : "2"           #版本
      },
      "syslogd": {
       "host" : "0.0.0.0",       #启用syslog记录日志
       "port" : "51400"
      },
      "global_filters" : {
       "whitelisted" : "false"            #全局过滤白名单
      },
      "global_warning_rules" : {          #全局警告 ip地址字符小于等于10时
       "rule_ip" : ["<=", 10 ],
       "global_rule_ip_ratio" : ["<", 5]
      },
      "global_success_rules" : {
       "global_rule_ip_ratio" : [">=", 10],
       "rule_ip" : [">=", 10]
      },
      "global_deny_rules" : {
       "global_rule_ip_ratio" : ["<", 2]
      },
      "naxsi" : {
       "rules_path" : "/usr/local/nginx/conf/naxsi_core.rules",
         #Naxsi核心规则,即黑名单
       "template_path" : [ "tpl/"],
       "geoipdb_path" : "nx_datas/country2coords.txt"#地理位置
      },
      "output" : {
       "colors" : "true",                   #屏幕输出带彩色
       "verbosity" : "5"
      }
      
    4. 先决条件,配置ElasticSearch,需要进行如下操作步骤。

      # 使用https://www.elastic.co/downloads/elasticsearch中的二进制文件下载存档。提取存档。通过bin/elasticsearch,在解压缩的文件夹中执行来启动ElasticSearch。检查ElasticSearch是否正常运行:
      curl -XGET http://localhost:9200/
      # 使用以下命令添加nxapi索引:
      curl -XPUT 'http://localhost:9200/nxapi/'
      
      # 使用数据填充ElasticSearch。启用学习模式。浏览网站,以在日志文件中生成数据。转到nxapi目录。使用以下命令将日志文件中的数据加载到ElasticSearch:
         ./nxtool.py -c nxapi.json --files=/PATH/TO/LOGFILE.LOG
      
      # 检查数据是否被正确添加
      curl -XPOST "http://localhost:9200/nxapi/events/_search?pretty" -d '{}'
      
      # 检查是否能正确看到nxtool
      ./nxtool.py -c nxapi.json -x
         
      
    5. 简单使用方法

      1. 获取db的信息:$ ./nxtool.py -x --colors -c nxapi.json.

      2. 发布数据库内容摘要,包括:

        1. 标记/未标记事件之间的比率。
        2. 标记事件是一个重要的概念,了解自己在学习方面的表现。假设刚开始学习,其标记比率为0%,这意味着没有为最近的事件编写任何白名单。一旦开始生成白名单,Nxapi会将数据库中的这些事件标记为白名单,将其排除在下一代生成过程中。它允许加快生成过程,但主要是为了了解处理最近误报的程度。
        3. 还可以使用标记机制从学习中排除明显的攻击模式。如果某个IP不断攻击网站并污染日志,可以提供nxapi和ip(-i/tmp/ips.txt–tag)来标记并从进程中排除它们。
        4. Top servers:提供最多例外情况的dst主机的TOP10列表。
        5. Top URI(s):提供最多例外情况的dst URI的TOP10列表。与–filter结合使用生成特定URI的白名单非常有用。
        6. Top Zones:最活跃的例外区域列表。
      3. 生成白名单。假设有以下输出:

        ./nxtool.py -c nxapi.json  -x --colors
        # Whitelist(ing) ratio :
        # false 79.96 % (total:196902/246244)
        # true 20.04 % (total:49342/246244)
        # Top servers :
        # www.x1.fr 21.93 % (total:43181/196915)
        # www.x2.fr 15.21 % (total:29945/196915)
        ...
        # Top URI(s) :
        # /foo/bar/test 8.55 % (total:16831/196915)
        # /user/register 5.62 % (total:11060/196915)
        # /index.php/ 4.26 % (total:8385/196915)
        ...
        # Top Zone(s) :
        # BODY 41.29 % (total:81309/196924)
        # HEADERS 23.2 % (total:45677/196924)
        # BODY|NAME 16.88 % (total:33243/196924)
        # ARGS 12.47 % (total:24566/196924)
        # URL 5.56 % (total:10947/196924)
        # ARGS|NAME 0.4 % (total:787/196924)
        # FILE_EXT 0.2 % (total:395/196924)
        # Top Peer(s) :
        # ...
        
      4. 为x1.fr生成白名单,因此将首先获得更精确的统计信息:

        ./nxtool.py -c nxapi.json  -x --colors -s www.x1.fr
        ...
        # Top URI(s) :
        # /foo/bar/test 8.55 % (total:16831/196915)
        # /index.php/ 4.26 % (total:8385/196915)
        ...
        
      5. 然后,尝试为/foo/bar/test页面生成白名单:

        ./nxtool.py -c nxapi.json -s www.x1.fr -f --filter 'uri /foo/bar/test' --slack
        ...
        #msg: A generic whitelist, true for the whole uri
        #Rule (1303) html close tag
        #total hits 126
        #content: 
        lyiuqhfnp,+<a+href="http://preemptivelove.org/">Cialis+forum</a>,+KKSXJyE,
        +[url=http://preemptivelove.org/]Viagra+or+cialis[/url],+XGRgnjn,+http
        #content: 
        4ThLQ6++<a+href="http://aoeymqcqbdby.com/">aoeymqcqbdby</a>,+[url=http:
        //ndtofuvzhpgq.com/]ndtofuvzhpgq[/url],+[link..
        #peers : x.y.z.w
        ...
        #uri : /faq/
        #var_name : numcommande
        #var_name : comment
        ...
        # success : global_rule_ip_ratio is 58.82
        # warnings : rule_ip is 10
        BasicRule  wl:1303 "mz:$URL:/foo/bar/test|BODY";
        
      6. Nxtool试图提供额外的信息,用来确定用户疑似攻击的访问请求是否为误报。

        1. content:实际为HTTP内容,仅在$naxsi_extensive_log设置为1时出现。
        2. uri:触发事件URI的示例。
        3. var_name:触发内容的变量名称的示例。
        4. 成功和警告:Nxapi将提供评分信息(请参阅“分数”)。
      7. 生成交互式白名单。

        1. 创建白名单的另一种方法是使用-g选项,此选项提供了一种生成白名单的交互方式。此选项使用EDITOR env变量并使用它来迭代弹性搜索实例中可用的所有服务器,如果未设置EDITOR env变量,它将尝试使用vi。可以在开头用字符“#”注释或删除。在选择服务器之后,它将迭代每个可用的URI和区域,以用于search服务器。如果想使用正则表达式,只有URI可用,可以在每行的开头添加一个想使用的正则表达式:

          uri /fr/foo/ ...
          ?uri /[a-z]{2,}/foo ...
          
        2. 完成所有选择后的-g选项将尝试生成与-f选项具有相同行为的wl,并在生成wl时将结果写入路径中的典型输出:

          generating wl with filters {u'whitelisted': u'false', 'uri': '/fr/foo',
          'server': 'x.com'}
          Writing in file: /tmp/server_x.com_0.wl
          
    6. 白名单生成的提示和技巧

      1. –filter是你的朋友,即需要被添加到白名单的URL,如果你有很多URL需要被添加到白名单,可以通过缩小白名单的搜索字段来提高速度,并减少误报。

      2. 用-t而不是-f。-f是“哑”生成模式,将尝试所有模板。如果提供的内容-t"ARGS/*"仅限特定于ARGS的模板,则将尝试使用白名单。

      3. 下面创建自己的模板。

      4. 官方提供的模板是一个通用的模板,虽然可以满足大部分需求,但是用户如果量身定制一套模板,不仅可以提升生成规则的效率,还能减少误报,毕竟每个公司的业务大不相同。

      5. 举一个实际的例子。处理magento,其中一个重复出现的模式是onepage,所以创建了特定的模板,如下:

        {
        "_success" : { "rule_ip" : [ ">", "1"]},
            "_msg" : "Magento checkout page (BODY|NAME)",
        "?uri" : "/checkout/onepage/.*",
            "zone" : "BODY|NAME",
            "id" : "1310 OR 1311"
        }
        
    7. 支持的选项

      1. 范围/过滤选项有以下几种:

        1. -s SERVER,–server=SERVER:将白名单生成或统计信息显示的上下文限制为特定的FQDN。
        2. –filter=FILTER:用于与现有模板/过滤器合并的过滤器(以字典的形式),如’uri/foobar zone BODY’。可以组合多个过滤器,例如,–filter"country FR"–filter"uri/foobar"。
      2. 白名单生成选项有以下几种:

        1. -t TEMPLATE,–template=TEMPLATE:给定模板文件的路径,尝试生成匹配的白名单。可能的白名单将与数据库进行测试,只保留具有“好”分数的白名单。如果TEMPLATE以’/'开头,则将其视为绝对路径;否则,它将从tpl/目录开始扩展。
        2. -f,–full-auto:尝试为rules_path中的所有模板生成白名单。
        3. –slack:将nxtool设置为忽略分数并显示所有生成的白名单。
      3. 标记选项有以下几种:

        1. -w WL_FILE,–whitelist-path=WL_FILE:给定白名单文件,在数据库中查找匹配的事件。
        2. -i IPS,–ip-path=IPS:给定一个ips列表(由\n分隔),找到数据库中的匹配事件。
        3. –tag:执行标记。如果未指定,则仅显示匹配事件。
        4. 统计生成选项:-x,–stats,生成有关当前数据库的统计信息。
    8. 导入数据,所有采集功能都需要Naxsi EXLOG/FMT内容。

      1. –files=FILES_IN:支持glob、gz bz2,即–files"/var/log/nginx/mysite.comerror.log*"。
      2. –fifo=FIFO_IN Path to a FIFO to be created & read from.[infinite]创建FIFO,增加F_SETPIPE_SZ并读取它。主要用于直接从Nginx日志中读取。
      3. –stdin:从标准输入读取。
      4. –no-timeout:禁止读操作超时(stdin/fifo)。
    9. 了解模板

      1. 模板在Nxapi中起着核心作用。默认情况下,只提供通用的模板,如果不是通用的模板,则需创建自己的模板。首先看一下通用的模板,了解它是如何工作的,如下:

        {
                "zone" : "HEADERS",
                "var_name" : "cookie",
                "id" : "?"
        }
        
      2. 下面介绍如何使用Nxtool工具生成白名单:

        1. 从nxapi.json中提取global_filters,并创建基本的ES过滤器:{“whitelisted”:“false”}。

        2. 合并基本的ES过滤器与提供的cmd行过滤器(–filter,-s www.x1.fr):{“whitelisted”:“false”,“server”:“www.x1.fr”}。

        3. 对于模板的每个静态字段,将其合并到基本的ES过滤器中:{“whitelisted”:“false”,“server”:“www.x1.fr”,“zone”:“HEADERS”,“var_name”:“cookie”}。

        4. 对于要扩展的每个字段(值为?):选择匹配基本的ES过滤器的此字段(id)的所有可能值(此处为1000和1001),尝试为每个可能值生成白名单,并评估其得分。

          { "whitelisted" : "false", "server" : "www.x1.fr", "zone" : "HEADERS",
          "var_name" : "cookie", "id" : "1000"}
          { "whitelisted" : "false", "server" : "www.x1.fr", "zone" : "HEADERS",
          "var_name" : "cookie", "id" : "1001"}
          
        5. 对于提供结果的每个最终集,输出白名单。模板支持:

          1. “field”:“value”:模板为true的异常中必须存在的静态值。
          2. “field”:“?”:必须是从数据库内容中扩展的值(当匹配静态和全局筛选器时),“字段”的唯一值将用于生成白名单(每个唯一值用于一个白名单)。
          3. “?field”:“regexp”:在数据库中搜索的字段的正则表达式。
          4. “_statics”:{“field”:“value”}:白名单生成时使用的静态值。不参与搜索过程,仅“输出”时间,即"_statics":{“id”:“0”}是白名单输出’wl:0’的唯一方法。
          5. “_msg”:“string”:一条文本消息,帮助用户理解模板的用途。
          6. “_success”:{…}:提供覆盖完成全局评分规则的字典。
          7. “_warnings”:{…}:提供覆盖完成全局评分规则的字典。
    10. 了解得分

    11. 评分机制:

      1. 评分机制是一种非常简单的方法,它依赖于三种评分表达式:_success、_warning和_deny。
      2. 只要在生成白名单时满足_success规则,就会将白名单的得分提高1。
      3. 只要在生成白名单时满足_warning规则,就会将白名单的得分降低1。
      4. 每当生成白名单时满足_deny规则,将禁用白名单输出。
    12. 为了理解评分机制,告诉模板和规则之间的区别至关重要。模板是一个.json文件,可以匹配许多事件;规则通常是模板结果的子部分。例如,如果我们有下面这些数据:

      [ {"id" : 1, "zone" : HEADERS, ip:A.A.A.A},
        {"id" : 2, "zone" : HEADERS, ip:A.A.A.A},
        {"id" : 1, "zone" : ARGS, ip:A.B.C.D}
      ]
      
    13. 这个模板为:

      {"id" : 1, "zone" : "?"}
      
    14. template_ip将是2,因为两个对等体触发ID为1的事件。但是,rule_ip将为1,因为两个生成的规则(‘id:1mz:ARGS’和’id:1mz:HEADERS’)由一个唯一的对等体触发。

    15. 如果存在–slack,则忽略评分,并显示所有可能的白名单。在正常情况下,将会显示超过0个点的白名单。在Nxapi中启用了默认过滤器,来自nxapi.json:

      "global_warning_rules" : {
        "rule_ip" : ["<=", 10 ],
        "global_rule_ip_ratio" : ["<", 5]
        },
      "global_success_rules" : {
        "global_rule_ip_ratio" : [">=", 10],
        "rule_ip" : [">=", 10]
        },
      "global_deny_rules" : {
       "global_rule_ip_ratio" : ["<", 2]
      
  10. Naxsi格式解析

    1. 所谓格式解析,其实就是Naxsi对请求内容所做的进一步的规则匹配,它支持SQL注入、XSS跨点脚本、JSON格式和未知的类型匹配,最后介绍怎样动态地开启格式解析。

    2. Raw_body

      1. RAW_BODY(>=0.55rc0)是一种允许Naxsi匹配其不知道要解析的内容模式。正如内部规则所述,当Naxsi不知道内容类型时,它将会纠结。如果id:11错误的内容类型被列入白名单,那么Naxsi将继续执行所有针对RAW_BODY的规则。配置如下:

        http {
        ...
        MainRule "id:4241" "s:DROP" "str:RANDOMTHINGS" "mz:RAW_BODY";
        ...
        location / {
         ...
         BasicRule wl:11 "mz:$URL:/|BODY";
         ...
        }
        ...
        
      2. 比如请求为:

        POST / ...
        Content-Type: RAFARAFA
        ...
        RANDOMTHINGS
        
      3. 然后将触发规则4241。但如果id:11未列入白名单,则规则4241将不会被触发,因为在这之前就被拦截了。Naxsi的行为类似于DROP-by-default防火墙,唯一的任务是为目标网站添加所需的ACCEPT规则,以使其正常工作。

    3. libinjection

      1. libinjection(拦截使用的库),是第三方库(由client9开发),旨在通过标记HTTP请求,从而检测请求中是否携带SQL注入(SQLi)和跨站点脚本(XSS)。该库集成在Naxsi中,有以下两个目的:通用检测XSS/SQLi;虚拟补丁。

      2. 通用检测

        1. 必须使用特定指令明确启用libinjection通用检测:LibInjectionXss或LibInjectionSql。它也可以在运行时使用修饰符启用:naxsi_flag_libinjection_xss和naxsi_flag_libinjection_sql。

        2. 通用libinjection_xss规则具有内部标识18,并且$LIBINJECTION_XSS的每个匹配增加8的命名分数。

        3. 通用libinjection_sql规则具有内部标识17,并且$LIBINJECTION_SQL的每个匹配增加8的命名分数。

        4. 阻止任何触发libinjection_xss请求的通用设置如下:

          location / {
           SecRulesEnabled;
           LibInjectionXss;
           CheckRule "$LIBINJECTION_XSS >= 8" BLOCK;
          ...
          }
          
        5. 对于libinjection_sql:

          location / {
           SecRulesEnabled;
           LibInjectionSql;
           CheckRule "$LIBINJECTION_SQL >= 8" BLOCK;
          ...
          }
          
        6. 当启用通用检测时,可以使用id17(libinjection_xss)或18(libinjection_sql)将误报列入白名单。使用运行时修饰符,代码如下:

          #/foobar as LOTS of sql injections
          if ($request_uri ~ ^/foobar(.*)$ ) {
              set $naxsi_flag_libinjection_sql 1;
          }
          ...
          location / {
           ...
           CheckRule "$LIBINJECTION_SQL >= 8" DROP;
           ...
          }
          
      3. 虚拟补丁(>=0.55rc2)

        1. 根据应用程序上下文,可能无法广泛启用libinjection。但是,libinjection也可以用于虚拟补丁:

          MainRule "d:libinj_xss" "s:DROP" "mz:$ARGS_VAR:ruuu" id:41231;
          
        2. 将GET变量’ruuu’的内容传递给libinjection,如果检测到xss,则删除请求:

          MainRule "d:libinj_sql" "s:DROP" "mz:$ARGS_VAR:ruuu" id:41231;
          
        3. DROP在GET变量’ruuu’中触发libinjection_sql的任何请求,使用虚拟补丁方法,可以无须特定地管理用户创建的规则。

    4. JSON格式

      1. 具有content-type的POST或PUT请求application/json将由Naxsi处理:所有规则定位BODY,也适用于JSON内容;特定变量的白名单(或规则)使用经典的$BODY_VAR:xx。

      2. 但是对于JSON,Naxsi不会深度跟踪,并且硬编码限制为10(深度)。例如:

        POST ...
        {
          "this" : { "will" : ["work", "does"],
          "it" : "??" },
          "tr<igger" : {"test_1234" : ["foobar", "will", "trigger", "it"]}
        }
        
      3. 匹配规则:

        MainRule "str:foobar" "msg:foobar test pattern" "mz:BODY" "s:$SQL:42"
        id:1999;
        
      4. 白名单:

        BasicRule wl:X "mz:$BODY_VAR:test_1234";
        
    5. 运行时修饰符

      1. Naxsi动态配置(>=0.49),Naxsi支持一组可以覆盖或修改其行为的有限变量。

        1. naxsi_flag_learning:如果存在,则此变量将覆盖Naxsi学习标志(0表示禁用学习,1表示启用它)。
        2. naxsi_flag_post_action:如果存在并设置为0,则此变量可用于在学习模式中禁用post_action。
        3. naxsi_flag_enable:如果存在,则此变量将覆盖Naxsi的SecRulesEnabled(0表示禁用Naxsi,1表示启用)。
        4. naxsi_extensive_log:如果存在(并设置为1),则此变量将强制Naxsi记录变量匹配规则的CONTENT(请参阅底部的注释)。
      2. 因为版本≥0.54,Naxsi在运行时也支持libinjection启用/禁用标志:

        1. naxsi_flag_libinjection_sql
        2. naxsi_flag_libinjection_xss
      3. Naxsi在Nginx的REWRITE阶段运行。因此,直接在Naxsi的位置设置这些变量是无效的(因为在变量集生效之前将调用Naxsi)。

      4. 下面的设置是对的:

         set $naxsi_flag_enable 0;
         location / {
         ...
         }
        
      5. 下面的设置是错误的:

         location / {
                  set $naxsi_flag_learning 1;
          ...
         }
        
      6. 话虽如此,但还是可以使用Nginx来改变Naxsi的行为。这些变量的存在将启用或禁用学习模式,Naxsi本身可以强制进行大量的日志记录用来调试。因此,可以执行Naxsi通常无法执行的操作。例如,根据在运行时设置的(Nginx)变量,修改其行为:

         # Disable naxsi if client ip is 127.0.0.1
         if ($remote_addr = "127.0.0.1") {
          set $naxsi_flag_enable 0;
         }
        
      7. naxsi_flag_learning:如果naxsi_flag_learning存在变量,则此值将覆盖Naxsi关于学习模式的当前静态配置。

         if ($remote_addr = "1.2.3.4") {
         set $naxsi_flag_learning 1;
         }
         location / {
         ...
         } 
        
      8. naxsi_flag_post_action:Naxsi可以使用post_action将请求直接转发到DeniedUrl位置。它默认关闭。

      9. naxsi_flag_enable:如果naxsi_flag_enable存在变量并设置为0,则在此请求中将禁用naxsi,允许在特定条件下部分禁用naxsi。若要为受信任用户需完全禁用naxsi:

         set $naxsi_flag_enable 0;
         location / {
         ...
         }
        
      10. naxsi_extensive_log:如果Naxsi_extensive_log变量存在并设置为1,则此变量将强制Naxsi记录变量匹配规则的CONTENT。由于可能会对性能产生影响,请谨慎使用。因为Naxsi会将详细的调试信息记录到nginx error_log,即:

      NAXSI_EXLOG: ip=%V&server=%V&uri=%V&id=%d&zone=%s&var_name=%V&content=%V
      
      1. 有关更多的详细信息,请参阅6.7.1节的Naxsi日志。

        1. naxsi_flag_libinjection_sql:如果设置为1,Naxsi会将每个已解析的内容传递给libinjection,并请求SQL注入检测;如果libinjection匹配,则触发内部规则libinjection_sql。
        2. naxsi_flag_libinjection_xss:如果设置为1,则naxsi会将每个已解析的内容传递给libinjection,并请求XSS检测;如果libinjection匹配,则触发内部规则libinjection_xss。
    6. 示例,本节将展示一些为了使网站能正常使用所要添加的白名单(BasicRule)规则示例,同时还将介绍规则示例的添加。

      1. 白名单示例

        1. 静态白名单示例

          完全禁用此位置的规则#1000,matchzone为空,因此白名单始终匹配。
          BasicRule wl:1000; 
          
          在名为GET参数的所有URL中禁用规则#1000foo:
          
          BasicRule wl:1000 "mz:$ARGS_VAR:foo";
          
          \#1000在foo为url命名的GET参数中禁用规则/bar:
          BasicRule wl:1000 "mz:$ARGS_VAR:foo|$URL:/bar";
          
          \#1000在url的所有GET参数中禁用规则/bar:
          
          BasicRule wl:1000 "mz:$URL:/bar|ARGS";
          
          \#1000在url所有GET参数NAMES中禁用规则(仅限名称,而不是内容):
          BasicRule wl:1000 "mz:ARGS|NAME";
          
          \#1000在url的所有GET参数NAMES(仅名称,而不是内容)中禁用规则/bar:
          BasicRule wl:1000 "mz:$URL:/bar|ARGS|NAME";
          
        2. 正则表达式白名单示例(>=0.52)

          \#1000在所有的GET参数中禁用规则,包含meh:
          BasicRule wl:1000 "mz:$ARGS_VAR_X:meh";
          
          禁用#1000以GET参数开头的规则meh:
          
          BasicRule wl:1000 "mz:$ARGS_VAR_X:^meh";
          
          禁用#1000所有匹配的GET参数中的规则meh_<number>:
          BasicRule wl:1000 "mz:$ARGS_VAR_X:^meh_[0-9]+$"
          
          \#1000对于以/foo开头的URL,禁用所有的GET参数中的规则:
          
          BasicRule wl:1000 "mz:$URL_X:^/foo|ARGS";
          
          禁用#1000所有的GET参数中的规则,以/foo开头的URL编号:
          BasicRule wl:1000 "mz:$URL_X:^/foo|$ARGS_VAR_X:^[0-9]";
          
        3. RAW_BODY白名单,以RAW_BODY为目标的白名单的编写方式与任何其他BODY规则相同。

          使用以下规则定位RAW_BODY:
          
          MainRule id:4241 s:DROP str:RANDOMTHINGS mz:RAW_BODY;
          
          白名单“ID:4241”将是:
          
          BasicRule wl:4241 "mz:$URL:/|BODY";
          
        4. FILE_EXT白名单

          将在URL/index.html上列出用于文件名的白名单规则1337:
          BasicRule wl:1337 "mz:$URL:/index.html|FILE_EXT";
          
        5. JSON白名单

          JSON作为普通的BODY处理,并在可能的情况下解析为变量:
          BasicRule wl:1302 "mz:$BODY_VAR:lol";
          
          将以下JSON正文列入白名单:
          {
           "lol" : "foo<bar"
          }
          
    7. 规则示例

      比如从POST、GET、PUT请求参数中过滤字符0x,如果匹配到字符串,则$SQL分数增加2。可以通过ID将规则列入白名单1002。如下:
      
      MainRule "str:0x" "msg:0x, possible hex encoding" "mz:BODY|URL|ARGS|
      $HEADERS_VAR:Cookie" "s:$SQL:2" id:1002;
      
      阻止user-agent:
      
      MainRule "str:w3af.sourceforge.net" "msg:DN SCAN w3af User Agent"
      "mz:$HEADERS_VAR:User-Agent" "s:$UWA:8" id:42000041 ;  
      
      阻止referer:
      
      BasicRule "str:http://www.shadowysite.com/" "msg:Bad referer" 
      "mz:$HEADERS_VAR:referer" "s:DROP" id:20001;
      
      阻止危险目录:
      
      MainRule "str:/magmi/" "msg:Access to magmi folder" "mz:URL" "s:$UWA:8"
      id:42000400;
      MainRule "str:/magmi.php" "msg:Access to magmi.php" "mz:URL" "s:$UWA:8"
      id:42000401;
      
      此规则将拒绝包含字符“<”的任何请求:
      
      MainRule id:4242 "str:<" "msg:xss (angle bracket)" "mz:$ARGS_VAR_X:
      ^foo$|$URL_X:^/product/[0-9]+/product$" s:DROP;
      
      文件上载,指阻止asp/php文件上传(核心规则的一部分)。如果上传的文件名包含ph(.php/.pht...).asp或.ht(.htaccess...)字符串,则累计分数增加8。
      
      MainRule "rx:\.ph|\.asp|\.ht" "msg:asp/php file upload!" "mz:FILE_EXT"
      "s:$UPLOAD:8" id:1500;
      
      Raw Body区域用于naxsi无法解析的内容类型(XML、Java序列化对象、非正统开发)。
      
      MainRule "id:4241" "s:DROP" "str:RANDOMTHINGS" "mz:RAW_BODY";
      MainRule "id:4241" "s:DROP" "d:libinj_xss" "mz:$ARGS_VAR:foo";
      
      LibInjection(SQL)虚拟补丁(>=0.55rc1),拒绝GET方法中带有foo字符串的访问请求。如下:
      
      MainRule "id:4241" "s:DROP" "d:libinj_sql" "mz:$ARGS_VAR:foo";
      
      消极的规则,将删除任何URL不以“/rest/”开头的请求:
      MainRule "id:4241" negative "s:DROP" "rx:^/rest/" "mz:URL";
      
  11. Naxsi深入探索

    1. 本节将带领读者进入Naxsi更深层次的使用,如Naxsi日志NAXSI_FMT格式的参数介绍,以及对NAXSI_EXLOG格式的讲解,这对于了解Web攻击拦截是不可或缺的;最后将介绍如何使用fail2ban来实现传输层的拦截。

    2. Naxsi日志

      NAXSI_FMT在错误日志中由naxsi输出:
      
      ------
      
      ```
      2019/02/27 13:39:43 [error] 21423#21423: *88461 NAXSI_FMT: ip=X.X.X.X&
      server=www.xxx.cn&uri=/x.php&learning=0&vers=0.56&total_processed=5354&
      total_blocked=545&block=1&cscore0=$XSS&score0=8&zone0=BODY&id0=1310&
      var_name0=2211&zone1=BODY&id1=1311&var_name1=2211, client: Y.Y.Y.Y,
      server: Y.Y.Y.Y, request: "POST /x.php HTTP/1.1", host: "Y.Y.Y.Y", referrer:
      "http://Y.Y.Y.Y/x.php"
      ```
      
      ------
      
      这里,客户端X.X.X.X对服务器的请求Y.Y.Y.Y确实触发了区域中2211命名的var中的规则。可能看起来很模糊,但可以在naxsi_core.rules中看到含义:
      
      ------
      
      ```
      MainRule "str:[" "msg:open square backet ([), possible js" "mz:BODY|URL|
      ARGS|$HEADERS_VAR:Cookie" "s:$XSS:4" id:1310;
      MainRule "str:]" "msg:close square bracket (]), possible js" "mz:BODY|URL|
      ARGS|$HEADERS_VAR:Cookie" "s:$XSS:4" id:1311;
      ```
      
      ------
      
      NAXSI_FMT由不同的项目组成:
      
      ·ip:客户的IP。
      
      ·server:请求的主机名(如http标头中的Host)。
      
      ·uri:请求的URI(没有参数,停在?)。
      
      ·learning:告诉Naxsi是否处于学习模式(0/1)。
      
      ·vers:Naxsi版本,仅从0.51开始。
      
      ·total_processed:Nginx的worker处理请求总数。
      
      ·total_blocked:(Naxsi)Nginx的worker阻止的请求总数。
      
      ·zoneN:匹配发生的区域。
      
      ·idN:匹配的规则ID。
      
      ·var_nameN:发生匹配的变量名称(可选)。
      
      ·cscoreN:命名分数标签。
      
      ·scoreN:关联的命名分数值。
      
      ![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/zy.jpg)注:几个zone、id、var_name、cscore和score组可以出现在一行中。
      
      NAXSI_EXLOG是一个补充日志,除此之外,还包含匹配请求的实际内容。虽然NAXSI_FMT包含ID和异常位置,但NAXSI_EXLOG提供了实际内容,允许判断它是否为误报。注意,它是在server区域添加变量,而不是在location区域添加变量:
      
      ------
      
      ```
      set $naxsi_extensive_log 1;
      ```
      
      ------
      
      此功能由运行时修饰符提供:
      
      ------
      
      ```
      2019/02/27 15:14:29 [error] 10555#0: *99 NAXSI_EXLOG: ip=X.X.X.X&server=
      Y.Y.Y.Y&uri=%2F&id=1315&zone=HEADERS&var_name=cookie&content=UM_distinctid
      %3D16855a1e83f21f-0496b2863839b2-334a5d69-13c680-16855a1e84025c%3B%20CN
      ZZDATA5879641%3Dcnzz_eid%253D23546660-1547623515-http%25253A%25252F
      %25252FY.Y.Y.Y%25252F%2526ntime%253D1547623515%3B%20JSESSIONID%3D99C5F8
      5C96CEDCA9710220D7FCE5643F%3B%20Hm_lvt_d8c422622c61552c51bfd58b680d3acd
      %3D1551251319%3B%20Hm_lpvt_d8c422622c61552c51bfd58b680d3acd%3D1551251648,
       client: X.X.X.X, server: Y.Y.Y.Y, request: "GET / HTTP/1.1", host:
      "Y.Y.Y.Y", referrer: "http://Y.Y.Y.Y/%3E/"
      2019/02/27 15:14:29 [error] 10555#0: *99 NAXSI_FMT: ip=X.X.X.X&server=
      Y.Y.Y.Y&uri=/&learning=1&vers=0.56&total_processed=4&total_blocked=4&block=
      1&cscore0=$XSS&score0=56&zone0=HEADERS&id0=1315&var_name0=cookie, client:
      X.X.X.X, server: Y.Y.Y.Y, request: "GET / HTTP/1.1", host: "Y.Y.Y.Y",
      referrer: "http://Y.Y.Y.Y/%3E/"
      ```
      
      ------
      
      Naxsi内部的ID,“用户定义的”规则应该具有ID>1000。较低1000的ID是为Naxsi内部规则保留的,这些规则通常和无法通过正则表达式或字符串匹配表达的事物相关。在将其中一个ID列入白名单之前请三思,因为它可能会禁用Naxsi。
      
    3. 内部规则

      内部规则是Naxsi可以触发的规则,当请求不正确或极不寻常时,或者Naxsi无法解析请求时就会触发内部规则。注意,这些规则不会设置内部分数,通常只需将block请求的标志设置为1。将内部规则列入白名单时,可能禁用了部分Naxsi,因此请三思而后行。具体可参见naxsi_core.rules文件。
      
      1.weird_request奇怪的请求
      
      ·id:1;
      
      ·动作:阻止;
      
      ·影响:传递。
      
      Naxsi无法理解的请求,即不支持的请求格式。当这个列入白名单时,Naxsi将盲目地接受请求而不是解析它。
      
      2.big_request太大的请求
      
      ·id:2;
      
      ·动作:阻止;
      
      ·影响:传递。
      
      用户传输的body过大,可以在Nginx的配置中调整client_body_buffer_size参数来进行控制。
      
      3.uncommon_hex_encoding不常见的十六进制编码
      
      ·id:10;
      
      ·动作:阻止;
      
      ·影响:部分丢失解码。
      
      十六进制编码无效。
      
      4.uncommon_content_type不常见的content_type
      
      ·id:11;
      
      ·动作:阻止;
      
      ·影响:彻底通过BODY。
      
      Naxsi未知的内容类型,意思是Naxsi无法解析。但是,如果“id:11”列入白名单且>=0.55rc2,则可以使用RAW_BODY规则。
      
      5.uncommon_url不常见的网址
      
      ·id:12;
      
      ·动作:阻止;
      
      ·影响:GET args上的部分pass-thru。
      
      不是标准的URL(即?x=foo&z=bar),为白名单时可能导致未正确解析的参数。
      
      6.uncommon_post_format不常见的提交格式
      
      ·id:13;
      
      ·动作:阻止;
      
      ·影响:彻底通过BODY。
      
      POST主体格式不正确,即:
      
      ·不好的内容;
      
      ·没有变量名;
      
      ·格式错误的附加文件内容类型。
      
      7.uncommon_post_boundary不常见的提交边界
      
      ·id:14;
      
      ·动作:阻止;
      
      ·影响:彻底通过BODY。
      
      POST主体格式不正确,即:
      
      ·不好的内容类型;
      
      ·边界不好(太短、太长、不符合rfc)。
      
      8.invalid_json无效的json格式
      
      ·id:15;
      
      ·动作:阻止;
      
      ·影响:彻底通过BODY(json);
      
      JSON格式不正确(即缺失'}]')。
      
      9.empty_body空的主体
      
      ·id:16;
      
      ·动作:阻止;
      
      ·影响:彻底通过BODY。
      
      当主体为空或内容长度为0时引发。
      
      10.libinjection_sql拦截sql
      
      ·id:17;
      
      ·动作:阻止。
      
      具体内容见6.5.2节的libinjection内容。
      
      11.libinjection_xss拦截xss
      
      ·id:18;
      
      ·动作:阻止。
      
      具体内容见6.5.2节的libinjection内容。
      
      12.empty空即没有配置规则
      
      ·id:19;
      
      ·动作:丢弃;
      
      ·影响:未检查规则。
      
      当Naxsi未配置任何MainRule时引发。
      
      13.bad_utf8损坏的utf8格式
      
      ·id:20;
      
      ·动作:丢弃。
      
      检测到代理utf8时触发。
      
      
      
    4. 与Fail2Ban整合

      Fail2Ban常用于阻止属于试图破坏系统安全性的IP地址。通常使用iptables拦截恶意IP地址,比如暴力破解SSH服务或Webmail登录帐号。
      
      虽然Naxsi可以从应用层阻止黑客攻击,但是黑客攻击时依旧会消耗服务器的资源,如带宽和CPU等,所以从网络层拦截之后,就不会消耗资源了。因此,这个方法将展示如何禁止在Naxsi日志中出现太多的人。
      
      非常简单,创建/etc/fail2ban/filter.d/nginx-naxsi.conf:
      
      ------
      
      ```
      [INCLUDES]
      before = common.conf
      [Definition]
      failregex = NAXSI_FMT: ip=<HOST>&server=.*&uri=.*&learning=0
                  NAXSI_FMT: ip=<HOST>.*&config=block
      ignoreregex = NAXSI_FMT: ip=<HOST>.*&config=learning
      ```
      
      ------
      
      添加/etc/fail2ban/jail.conf:
      
      ------
      
      ```
      [nginx-naxsi]
      enabled = true
      port = http,https
      filter = nginx-naxsi
      logpath = /var/log/nginx/*error.log
      maxretry = 6
      ```
      
      ------
      
      所以在/var/log/fail2ban.log日志记录中,相同的IP在5分钟内6次触发Naxsi(fail2ban findtime=600)时就会被拦截:
      
      ------
      
      ```
      2019-02-27 15:34:44,016 fail2ban.actions: WARNING [nginx-naxsi] Ban 
      88.z.x.y`
      ```
      
      ------
      
      
      

ngx dynamic limit req module动态限流

  1. 本章主要介绍ngx_dynamic_limit_req_module模块的实现原理、安装方法、使用步骤及适用的场景。此外,还会着重讲解Nginx变量的功能和用途,以及常见的Web攻击方式和防御方法,最后延伸出其他功能PV、UV及API计数的实现。每个接口都是有请求上限的,当访问频率或者并发量超过其承受范围的时候,要么扩容,要么牺牲一部分请求。考虑到成本问题,就必须考虑限流来保证接口的可用性。这里可参考熔断机制,比如电表上的保险装制,当电压过大时会自动熔断,用以防止线路短路引发火灾或者破坏其他电器设备的风险。通常的策略就是丢弃多余的请求或者让多余的请求进入队列排队等待。所以,ngx_dynamic_limit_req_module应需求而出现,该模块可用于动态IP锁定并定期释放。

  2. 实现原理

    1. ngx_dynamic_limit_req_module模块用于限制每个定义密钥的请求处理速率,特别是来自单个IP地址的请求处理速率。常用的限流算法有两种,即漏桶算法和令牌桶算法,该模块使用“漏桶”方法进行限流。

    2. 限流算法

      1. 漏桶算法的思路很简单,水(请求)先进入漏桶里,漏桶以一定的速度出水,当水流入速度过大时会直接溢出,可用于峰值速率或频率的限制。漏桶算法其实有两种实现,这里不作细究。如图7.1所示为漏桶算法示意图。
      2. 令牌桶算法基于固定容量桶的类比即固定速率,通常以字节或预定大小的单个包的令牌为单位。
      3. 当要检查数据包是否符合定义的限制时,将检查存储桶以查看其当时是否包含足够的令牌。如果是,则移除(兑现)适当数量的令牌。
      4. 如果桶中没有足够的令牌,则包不符合,并且桶的内容不会改变。可以通过各种方式处理不符合的数据包,丢弃或者进入队列排队(可以理解成先到先得)。如图7.2所示为令牌桶算法示意图。
    3. 应用场景

      1. 很多公司都会在节假日前做活动,如积分抽奖、朋友圈微信投票,其截止日期通常都是几天不等。很多人都会有这种经历:微信好友会时不时给你发个投票链接。可是每个人的好友数量都是有限的,于是有些人就开始花钱买票,而“刷票”公司接单后开始干活,进而服务器的负载开始上升,影响其他正常的业务。
      2. 还有就是大家熟悉的购票经历,每当春节放假的时候,网上的票就不好买了,票一出来几乎就售罄了,很多人不得不花钱让“黄牛”购票。为什么“黄牛”可以买到票?因为他们租用了大量的机器带宽用程序不停地爬取接口,一旦有票就会被“秒抢”,人工“刷票”几乎没机会买到。
      3. 通常大规模的流量攻击来自于竞争对手或者恶意破坏,此时被攻击者一般会请求警方协助解决,那么攻击者的作案风险就增加了,所以这种大流量攻击比较少见的。
      4. 很多网站都会做压力测试,以便了解整个架构能抗住多少用户量,也为以后扩展做准备。世间事物都是相对而言的,放在这里也同样适用。正面是压力测试,反面就是CC攻击了。压测工具没有错,错的是使用它的人。
      5. 目前,“黑产”人员只需要通过卡商和接码平台即可获得手机号和验证码,而接码平台则利用猫池、群控等工具接收来自互联网平台下发的短信或语音验证码,突破互联网平台的安全防护措施,然后通过改机工具伪造设备硬件信息,使用动态IP拨号等工具伪造网络环境,最终利用自动化程序工具完成整个注册流程。
      6. 目前一些“黑产”团伙研发出的所谓任务平台,将其包装为兼职、任务分派等多种有偿形式,引诱普通用户参与,并衍生出辅助注册、辅助解封,以及出租、购买正常用户账号的产业链。
      7. 衡量一个网站的人气,人们通常会参考它的页面浏览量,简称PV(页面视图)。具体而言,PV值是所有访问者24小时内查看一个站点中的页面数或次数。PV是一次刷新页面,一次PV流量。
      8. UV(唯一访问者)是指许多人访问一个站点或者App时生成的唯一标识,而唯一标识有不同的维度可以计量,如访问者的IP地址、设备ID、用户ID、手机号码等。以IP地址作为UV统计的计量标准时,则会出现以下两种情况:
        1. IP大于UV:手机用户的IP地址会随着不同省份基站而改变.例如一个用户同一天坐火车经过多个省,那么他在使用网络期间的IP地址每次都会不同。
        2. IP小于UV:这种情况一般出现在网吧、学校和公司等场景,因为他们的网络是通过NAT网络转换过的,对外的IP地址只有一个,所以会出现多个用户一个IP的情形。
    4. 安装

      1. 在安装ngx_dynamic_limit_req_module模块之前,需要从http://nginx.org/en/download.html网站上下载最新版本的Nginx,还要依懒Redis。下面演示的是针对版本nginx-1.15.8.tar.gz和redis-5.0.3.tar.gz所执行的步骤。

        root@debian:~/bookscode# wget http://nginx.org/download/nginx-1.15.8.tar.gz
        root@debian:~/bookscode# git clone https://github.com/limithit/ngx_dynamic_
        limit_req_module.git
        root@debian:~/bookscode# wget http://download.redis.io/releases/redis-5.0.3.tar.gz
        root@debian:~/bookscode# tar zxvf redis-5.0.3.tar.gz
        root@debian:~/bookscode#cd redis-5.0.3&& make   #编译
        root@debian:~/bookscode/redis-5.0.3# make test    #测试
        root@debian:~/bookscode/redis-5.0.3/deps/hiredis#make&& make install
          #编译和安装
        root@debian:~/bookscode/redis-5.0.3/src#cpredis-serverredis-sentinelredis-
        cliredis-benchmarkredis-check-rdbredis-check-aof /usr/local/bin/
              #复制编译好的程序到/usr/local/bin/下
        root@debian:~/bookscode/redis-5.0.3/utils# ./install_server.sh
            #执行安装脚本
        
      2. install_server.sh脚本运行时会有一些交互式输入,其中包括端口、配置文件、日志位置和可执行文件位置等,可以手动输入,也可以使用默认值,这样很快就可以使用Redis了。接下来开始安装Nginx和ngx_dynamic_limit_req_module,如下:

        root@debian:~/bookscode# tar zxvf nginx-1.15.8.tar.gz
        root@debian:~/bookscode# cd nginx-1.15.8
        root@debian:~/bookscode/nginx-1.15.8# ./configure --prefix=/usr/share/
        nginx --sbin-path=/usr/sbin/nginx --modules-path=/usr/lib64/nginx/modules
        --conf-path=/etc/nginx/nginx.conf --error-log-path=/var/log/nginx/error.log
         --http-log-path=/var/log/nginx/access.log --http-client-body-temp-path=
        /var/lib/nginx/tmp/client_body --http-proxy-temp-path=/var/lib/nginx/tmp/
        proxy --http-fastcgi-temp-path=/var/lib/nginx/tmp/fastcgi --http-uwsgi-
        temp-path=/var/lib/nginx/tmp/uwsgi --http-scgi-temp-path=/var/lib/nginx/
        tmp/scgi --pid-path=/run/nginx.pid --lock-path=/run/lock/subsys/nginx
        --user=nginx --group=nginx --with-http_auth_request_module --with-http_
        ssl_module --with-http_v2_module --with-http_realip_module --with-http_
        addition_module --with-http_xslt_module  --with-http_geoip_module --with-
        http_sub_module --with-http_dav_module --with-http_flv_module --with-
        http_mp4_module --with-http_gunzip_module --with-http_gzip_static_module
        --with-http_random_index_module --with-http_secure_link_module --with-http_
        degradation_module --with-http_slice_module --with-http_stub_status_module
        --with-http_perl_module --with-mail --with-mail_ssl_module --with-pcre
        --with-pcre-jit --with-stream --with-stream_ssl_module  --with-debug  --add
        -module=../ngx_dynamic_limit_req_module#设置编译参数,添加第三方模块,检测
          编译环境
        root@debian:~/bookscode/nginx-1.15.8# make -j4#开始编译,j4是因为我的是四核
        root@debian:~/bookscode/nginx-1.15.8# make install#安装
        root@debian:~/bookscode/nginx-1.15.8# nginx–t    #测试是否正常
        
      3. configure会检查依赖,如果缺少某个库或者某个库的版本过低,则需要安装或者升级依赖库版本,之后再次运行configure检查直到没有错误提示为止,然后就可以进行编译了。

  3. 功能

    1. 安装好后,本节来看一下ngx_dynamic_limit_req_module具体有哪些作用。

    2. CC防卸

      1. CC攻击的原理就是让攻击者控制某些主机,不停地发送大量的数据包,给对方服务器造成资源耗尽,直到服务崩溃为止。
      2. CC攻击主要用来消耗服务器资源。每个人都有这样的体验:当一个网页访问的人数特别多的时候,网页响应就变慢了。CC就是模拟多个用户,不停地访问那些需要大量数据操作的页面,从而造成服务器资源的浪费,使CPU长时间处于工作状态,永远都有处理不完的连接,直至网络拥塞,正常的访问被中止。
    3. 暴力破解

      1. 暴力破解法就是列举法,将口令集合到一起,然后逐个尝试直到登录成功。有时结合字典效率会高一点,不过字典不一定猜得准。可以说暴力破解是一种笨办法,但有时却是唯一的办法。暴力破解是在查找漏洞一筹莫展时,或在漏洞利用不顺利时所能依靠的方法。
      2. 如果把网站当作一间屋子,那么漏洞是门,弱密码就是窗户。也许门牢不可破,窗户是防弹玻璃的,但被击打的次数多了也会破裂,而攻击者就可以打破窗户后进入房间,只是进入房间的途径不同而已。
    4. 恶意刷接口

      1. 恶意刷接口主要有两种途径,而判断的依据是频率和次数:一种是人工频繁点击,另一种是通过软件连续点击。就危害性来说,通过软件连续点击的危害要大得多。其原因简单归类有如下几个:
        1. 牟利:如在12306网上抢票倒卖,伪造公众号阅读量等。
        2. 恶意攻击竞争对手:如短信接口被请求一次,会触发几分钱的运营商费用,当请求量大时费用也很可观。
        3. 压测:做压力测试。
        4. 恶意注册:是指不以正常使用为目的,违反国家规定和平台注册规则,利用多种途径取得的手机卡号等作为注册资料,使用虚假或非法途径取得的身份信息,突破互联网安全防护,批量创设网络账号的行为。
    5. 分布式代理恶意请求

      1. 当攻击者刷新接口时,会触发拦截条件(比如每秒只允许50个请求,超过就视为触发拦截),IP地址就会被禁止访问,这时候攻击者会思考如何重新访问,自然而然就会想到使用代理。其实就是攻击者有大量的代理IP库,被拦截后就会换个IP地址继续刷单。
      2. 当然还可以再智能一点儿,即攻击者的每个IP只请求几次,然后就切换成其他IP继续请求,以车轮战的方式来刷单,但这样做需要调度程序来分配任务。
      3. 工作量也大大增加,普通的攻击者并不具备定制开发攻击程序的能力,更多的是脚本小子。即使开发出来,我们也可以相应地变动策略来防护。
      4. DDoS原理
        1. DDoS是由传统式的DoS(Denial of Service)演变而来的,传统式的DoS攻击原理是黑客使用较强大的单一计算机去攻击用户的IP,属于一对一的攻击状态,其目的是使网络服务提供者的服务完全瘫痪;而现今的计算机科技日益发展,许多黑客都是使用分布式阻断服务方式(DDoS)来展开攻击。
        2. ▲分布式阻断服务DDoS(Distributed Denial of Service,DDoS):当黑客使用网络上多个被攻陷的计算机作为“僵尸”向特定的目标发动阻断服务式攻击时,称为分布式阻断服务攻击。
        3. DDoS的攻击方式是入侵大量主机后将DDoS攻击程序安装至被攻击主机内,控制被攻击主机开始对发动目标进行攻击,从而造成网站无法联机甚至瘫痪。而许多人经常在不知情的状况下成了DDoS的攻击共犯,因为黑客是以间接的方式入侵大量计算机实施攻击的,而你的主机或许就是其中一台。
        4. ▲为何DDoS难以预测?
        5. 难以预测的原因是无法分辨哪一笔联机才是黑客攻击,因DDoS的手法并非攻击,而是操控大量的计算机同时间向服务器要求正常的联机,使得防火墙无法判别DDoS攻击。
    6. 动态定时拦截

      1. Nginx自带的CC防御功能虽然可以阻挡CC攻击,但不能在指定的时间段进行阻止。例如,某考生在参加高考时作弊被发现,不但要取消其考试资格,并且其几年之内不得再参加考试。如果攻击者持续攻击的话,那么这个锁定时间就会不停地重置为10分钟,直到停止攻击,锁定时间才会开始递减,锁定时间以秒为单位。
      2. 为了使读者更明白,这里解释下持续攻击的定义:当发现攻击者刷票时会被拦截,但攻击者可能并不会放弃,而是会一直刷新页面,直到看到页面为止。假设把拦截时间看成是一桶满水,漏完了才可以再次访问,但是攻击者如果一直攻击,那么这桶水就会不停地被加满,而不是随着时间的流逝慢慢漏下去。除非攻击者停止攻击,它才会不再加满慢慢地漏完,在水漏完后就可以正常访问了。
    7. 黑名单和白名单

      1. 其实Nginx也有黑名单和白名单功能,对应的指令则为deny和allow指令,只不过它们不能动态增加和删除,也不能在CC防御的时候加白名单。出于一些安全因素的考虑,部分网址或者接口只允许指定的IP地址才能访问。

      2. 比如,内部使用OA和CRM一类的接口不需要对外开放,以降低数据泄漏的风险。另外还设置了拦截条件为每秒50个请求,超过这个条件就被拦截,但如果条件已在白名单里了,那么即使触发了这个条件也会放行,这对于内部压测时很方便。

      3. 动态增加的意思是不需要重新加载配置文件。例如一些CDN厂商,每天增加白名单很多次,然后重新加载配置,这样会花费很多时间。动态增加就不存在这种顾虑,添加即生效。

      4. nginx.conf黑白名单示例如下:

        location / {
        deny  192.168.1.1;
        allow 192.168.1.0/24;
        allow 10.1.1.0/16;
        allow 2001:0db8::/32;
        deny  all;
        }
        
  4. 配置指令

    1. 在面对不同的攻击类型时,则需要不同的拦截策略,所以如何设置参数是极其重要的。所谓授人以鱼不如授人以渔,在学习完配置指令后,相信读者也可以将其灵活运用到自己的场景中。

    2. dynamic_limit_req_zone设置区域参数

      变量(key)是在Nginx配置文件nginx中经常用到的值,在ngx_dynamic_limit_rep_module中也会用到,所以本节将列出一部分参数值进行说明。
      
      设置共享内存区域的参数,该区域将保留各种Key的状态。Key可以包含文本、变量及其组合。具有空键值的请求不计算在内,例如:
      
      ------
      
      ```
      Syntax:  dynamic_limit_req_zone key zone=name:size rate=rate [sync] redis=127.0.0.1 block_second=time;
      Default: —
      Context: http
      ```
      
      ------
      
      key是一个变量,后面将重点讲解。读者可在Nginx源代码nginx/src/http/ngx_http_variables.c的大概157行处进行查看,更多的其他模块变量,可在http://nginx.org/en/docs/varindex.html中查看。
      
      ·$http_user_agent:用户的浏览器头部,例如:
      
      ------
      
      ```
      $http_user_agent: User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50
      ```
      
      ------
      
      ·$binary_remote_addr:客户端的IP地址,例如:
      
      ------
      
      ```
      $binary_remote_addr: 8.8.8.8
      ```
      
      ------
      
      ·$server_name:当前服务的域名。如果是虚拟主机中,则该名称是由那个虚拟主机所设置的值决定。例如:
      
      ------
      
      ```
      $server_name  www.nginx.org
      ```
      
      ------
      
      ·$uri:请求的文件和路径,不包含“?”或者“#”之类的符号。例如:
      
      ------
      
      ```
      $uri: www.nginx.org/document
      ```
      
      ------
      
      ·$request_uri:请求的整个字符串,包含后面请求的内容。例如:
      
      ------
      
      ```
      $request_uri: www.nginx.org/document?x=1
      ```
      
      ------
      
      ·$arg_name:请求中的参数名,即“?”后面arg_name=arg_value形式的arg_name。
      
      ·$args:请求中的参数值。
      
      ·$body_bytes_sent:传输给客户端的字节数,响应头不计算在内;这个变量和Apache的mod_log_config模块中的“%B”参数保持兼容。
      
      ·$bytes_sent:传输给客户端的字节数。
      
      ·$connection:TCP连接的序列号。
      
      ·$connection_requests:TCP连接当前的请求数量。
      
      ·$content_length:Content-Length请求头字段长度。
      
      ·$content_type:Content-Type请求头字段类型。
      
      ·$document_root:当前请求的文档根目录或别名。
      
      ·$document_uri:同$uri。
      
      ·$host:优先级如下:HTTP请求行的主机名>HOST请求头字段>符合请求的服务器名。
      
      ·$http_name:匹配任意请求头字段。变量名中的后半部分name可以替换成任意请求头字段。例如在配置文件中需要获取http请求头Accept-Language,那么可以将“-”替换为下划线,大写字母替换为小写字母,形如$http_accept_language即可。
      
      ·$https:如果开启了SSL安全模式,那么值为on,否则为空字符串。
      
      ·$is_args:如果请求中有参数,那么值为“?”,否则为空字符串。
      
      ·$limit_rate:用于设置响应的速度限制,详见limit_rate。
      
      ·$msec:当前的UNIX时间戳。
      
      ·$nginx_version:Nginx版本。
      
      ·$pid:工作进程的PID。
      
      ·$pipe:如果请求来自管道通信,那么值为p,否则为“.”。
      
      ·$proxy_protocol_addr:获取代理访问服务器的客户端地址,如果是直接访问,则该值为空字符串。
      
      ·$proxy_protocol_port:获取代理访问服务器的客户端地址端口。
      
      ·$query_string:同$args。
      
      ·$realpath_root:当前请求的文档根目录或别名的真实路径,会将所有符号连接转换为真实路径。
      
      ·$remote_addr:客户端地址。
      
      ·$remote_port:客户端端口。
      
      ·$remote_user:用于HTTP基础认证服务的用户名。
      
      ·$request:代表客户端的请求地址。
      
      ·$request_body:客户端的请求主体。此变量可在location中使用,将请求主体通过proxy_pass、fastcgi_pass、uwsgi_pass和scgi_pass传递给下一级的代理服务器。
      
      ·$request_body_file:将客户端请求主体保存在临时文件中。文件处理结束后,此文件需删除。如果需要开启此功能,则需要设置client_body_in_file_only。如果将此文件传递给后端的代理服务器,则需要禁用request body,即设置proxy_pass_request_body off、fastcgi_pass_request_body off、uwsgi_pass_request_body off和or scgi_pass_request_body off。
      
      ·$request_completion:如果请求成功,则值为“OK”,如果请求未完成或者请求不是一个范围请求的最后一部分,则为空。
      
      ·$request_filename:当前连接请求的文件路径,由root或alias指令与URI请求生成。
      
      ·$request_length:请求的长度(包括请求的地址,http请求头和请求主体)。
      
      ·$request_method:HTTP请求方法,通常为GET或POST。
      
      ·$request_time:处理客户端请求使用的时间;从读取客户端的第一个字节开始计时。
      
      ·$scheme:请求使用的Web协议、HTTP或HTTPS。
      
      ·$server_addr:服务器端地址。需要注意的是,为了避免访问Linux系统内核,应将IP地址提前设置在配置文件中。
      
      ·$server_port:服务器端口。
      
      ·$server_protocol:服务器的HTTP版本,通常为HTTP1.0或HTTP1.1。
      
      ·$status:HTTP响应代码。
      
      ·$tcpinfo_rtt、$tcpinfo_rttvar、$tcpinfo_snd_cwnd、$tcpinfo_rcv_space:客户端TCP连接的具体信息。
      
      ·$time_iso8601:服务器时间的ISO8610格式。
      
      ·$time_local:服务器时间的LOG Format格式。
      
      ·$http_referer:简而言之,HTTP Referer是header的一部分,当浏览器向Web服务器发送请求的时候,一般会带上Referer,告诉服务器是从哪个页面链接过来的,服务器藉此可以获得一些信息用于处理。比如从我的主页上链接到一个朋友的主页,那么他的服务器就能从HTTP Referer中统计出每天有多少用户通过点击我的主页上的链接访问了他的网站。
      
      ·$http_via:Via HTTP标头的值,它通知客户端可能使用的代理。
      
      ·$http_x_forwarded_for:X-Forwarded-For HTTP标头的值,如果客户端位于代理后面,则显示客户端的实际IP地址。
      
      ·$http_cookie:Cookie HTTP标头的值,包含客户端发送的cookie数据。
      
      ·$request_id:请求的唯一ID。
      
      ·$sent_http_content_type:Content-Type HTTP标头的值,指示正在传输的资源的MIME类型。
      
      ·$sent_http_content_length:Content-Length HTTP标头的值,通知客户端响应主体长度。
      
      ·$sent_http_connection:Connection HTTP标头的值,用于定义连接是保持活动还是关闭的状态,有close、upgrade和keep-alive这3个状态。
      
      ·$sent_http_location:Location HTTP标头的值,表示该位置。
      
      ·$sent_http_last_modified:与所请求资源的修改日期对应的Last-Modified HTTP标头的值。
      
      ·$sent_http_keep_alive:发送的超时时间。
      
      ·$sent_http_transfer_encoding:Transfer-Encoding HTTP标头的值,提供有关响应主体的信息。
      
      ·$sent_http_cache_control:Cache-Control HTTP标头的值,告诉我们客户端浏览器是否应该缓存资源。
      
      ·$hostname:主机名等同hostname命令获取的值。
      
      ·$http_host:Host HTTP标头的值,一个字符串,指示客户端尝试访问的主机名。用法示例如下:
      
      ------
      
      ```
      dynamic_limit_req_zone $binary_remote_addr zone=one:10m rate=100r/s
      redis=127.0.0.1 block_second=600;
      ```
      
      ------
      
      其中,状态保持在10兆字节区域“one”,并且该区域的平均请求处理速率不能超过每秒100个请求。
      
      但在这里,客户端IP地址用作密钥。需要注意的是,该值不是$remote_addr,而应该是$binary_remote_addr变量。$binary_remote_addr相对于IPv4地址,变量的大小始终为4个字节;相对于IPv6地址,变量的大小始终为16个字节。存储状态在32位平台上总是占用64个字节,在64位平台上占用128个字节。一兆字节区域可以保留大约16 000个64字节状态或大约8 000个128字节状态。
      
      如果区域存储耗尽,则删除最近最少使用的状态,即使在此之后无法创建新状态,该请求也会因错误而终止。
      
      速率以每秒请求数(r/s)指定。如果需要每秒少于一个请求的速率,则在每分钟请求(r/m)中指定。例如,每分钟请求为30r/m。
      
      Redis连接地址为本地(也可以远程地址,但不建议使用),不要使用域名,端口默认为6379,不可修改,锁定时间为600秒即10分钟。
      
      
      
    3. dynamic_limit_req设置队列

      1. dynamic_limit_req用于设置共享内存区域和请求的最大队列。如果请求速率超过区域配置的速率,则延迟其处理,以便以定义的速率来处理请求。如果过多的请求被延迟,等到它们的数量超过最大队列后请求将以错误终止。默认情况下,最大队列等于0,语法如下:

        Syntax:  dynamic_limit_req zone=name [burst=number] [nodelay | delay=
        number];
        Default: —
        Context: http, server, location, if
        
    4. dynamic_limit_req_log_level设置日志级别

      1. dynamic_limit_req_log_level用于设置所需的日志记录级别。如果指定了dynamic_limit_req_log_level notice,则会使用INFO级别记录延迟。其实不需要改,默认即可,语法如下:

        Syntax:  dynamic_limit_req_log_level info | notice | warn | error;
        Default: dynamic_limit_req_log_level error;
        Context: http, server, location
        
    5. dynamic_limit_req_status设置响应状态

      1. dynamic_limit_req_status用于设置要响应拒绝的请求而返回的状态,语法如下:

        Syntax:  dynamic_limit_req_status code;
        Default: dynamic_limit_req_status 503;
        Context: http, server, location, if
        
    6. black-and-white-list设置黑名单和白名单

      black-and-white-list用于添加白名单:
      
      ------
      
      ```
      redis-cli set whiteipip
      ```
      
      ------
      
      用法示例:
      
      ------
      
      ```
      redis-cli set white192.168.1.1 192.168.1.1
      ```
      
      ------
      
      添加黑名单:
      
      ------
      
      ```
      redis-cli set ip ip
      ```
      
      ------
      
      用法示例:
      
      ------
      
      ```
      redis-cli set 192.168.1.2 192.168.1.2
      ```
      
      ------
      
      
      
  5. 扩展功能

    1. 为什么说是扩展功能呢?因为该功能不是每个人都需要掌握的,所以并没有合并到主干中。有需要用到的在分支里下载即可,本节主要介绍API实时计数,如下:

      git clone https://github.com/limithit/ngx_dynamic_limit_req_module.git
      cdngx_dynamic_limit_req_module
      git checkout limithit-API_alerts                         #复制源码并切换到分支中
      
    2. API实时计数、PV、UV统计

      1. Redis以天为周期记录总的(单个域名相加之和)PV、UV(以独立IP为数据),单个域名的PV,以及每个页面的请求次数。当然这取决于筛选条件(http、server、location、if)。如图7.3所示,图中标出部分为不同的域名。
    3. API阈值通知

      1. 1. 1. API阈值通知的配置指令需要注意,有变动,具体如下:
      
      ------
      
      ```
      Syntax:  dynamic_limit_req zone=name [burst=number] [nodelay | delay=
      number] mail_to=**@mail.com api_max=number;
           OR:  dynamic_limit_req zone=name [burst=number] [nodelay | delay=
      number];
       Default: —
       Context: http, server, location, if
      example:       if ($document_uri ~* "about"){
      dynamic_limit_req zone=one burst=30 nodelay mail_to=123@qq.com api_max=200;
      dynamic_limit_req_status 405;
                        }
      ```
      
      ------
      
      当需要邮件通知时才填写收件人的邮箱地址。注意,发邮件的方式是用postfix或者exim4方式,在使用邮件功能前,需要测试(因为现在的云厂商把25端口封禁了)邮件能否正常发送。用命令echo"test"|mail-s'try'***@qq.com检测,之后去邮箱里看下(垃圾箱),如正常接收的话,直接添加邮箱白名单即可。mail_to是要通知的邮箱,而api_max是当请求达到200次以上才发邮件通知。注意,5分钟内只发一次提醒。
      
      完整的示例配置如下:
      
      ------
      
      ```
           ...
      http {
           ...
      dynamic_limit_req_zone $binary_remote_addr zone=one:10m rate=100r/s redis=
      127.0.0.1 block_second=300;                   #每秒最多100个请求,超过锁定300秒
      dynamic_limit_req_zone $binary_remote_addr zone=two:10m rate=50r/s redis=
      127.0.0.1 block_second=600;                   #每秒最多50个请求,超过锁定10分钟
      dynamic_limit_req_zone $binary_remote_addr zone=sms:5m rate=5r/m redis=
      127.0.0.1 block_second=1800;                   #每分钟5个请求,超过锁半个小时
      server {
              listen       80;                                           #监听端口
      server_name  node1.nginx.org;                               #域名
      location / {
      root   html;
      index  index.html index.htm;
      dynamic_limit_req zone=one burst=100 nodelay;      #burst可以理解成队列
      dynamic_limit_req_status 403;                               #被拦截时返回状态
              }
      error_page   403 500 502 503 504  /50x.html;       #自定义错误页面
      location = /50x.html {
      root   html;
              }
          }
      server {
      listen       80;
      server_name  node2.nginx.org;
      location / {
      root   html;
      index  index.html index.htm; 
                      set $flag 0;                                     #自定义变量
                     if ($document_uri ~* "regist"){       #满足条件1时$flag=01
      set $flag "${flag}1";
                          }
                    if ($request_method = POST ) {             #满足条件2时$flag=02
      set $flag "${flag}2";
                          }
                        if ($flag = "012"){                         #同时满足条件1和2时
      dynamic_limit_req zone=sms burst=3 nodelay;      #当一分钟内达到3个请求时
      dynamic_limit_req_status 403;                               #被拦截时返回状态
                        }
                        if ($document_uri ~* "getSmsVerifyCode.do"){
                                 #当url含有#getSmsVerifyCode.do限制成1分钟内最多5个请求
      dynamic_limit_req zone=sms burst=5 nodelay;
      dynamic_limit_req_status 444;                               #被拦截时返回状态
                  }
      dynamic_limit_req zone=two burst=50 nodelay mail_to=**@qq.com api_max=200 ;
      #localhost2全局设置,每秒最多50个请求,并且当任意一个URL请求达到200次时,发邮件
      给指定邮箱
      dynamic_limit_req_status 403;                               #被拦截时返回状态
              }
      error_page   403 502 503 504  /50x.html;             #自定义错误页面
      location = /50x.html {
      root   html;
              }
          }
      }
      ```
      
      ------
      
      这个例子里node1.nginx.org的筛选条件(http、server、location、if)是location,意味着在访问node1.nginx.org全局页面时,一旦超过队列限制就会被拦截。配置如下:
      
      ------
      
      ```
      server {
              listen       80;                                           #监听端口
      server_name  node1.nginx.org;                               #域名
      location / {
      root   html;
      index  index.html index.htm;
      dynamic_limit_req zone=one burst=100 nodelay;      #burst可以理解成队列
      dynamic_limit_req_status 403;                               #被拦截时返回状态
              }
      error_page   403 500 502 503 504  /50x.html;      #自定义错误页面
      location = /50x.html {
      root   html;
              }
          }
      ```
      
      ------
      
      而在node2.nginx.org中筛选条件有3个,在if、location区域中代码如下:
      
      ------
      
      ```
      server {
      listen       80;
      server_name  node2.nginx.org;
      location / {
      root   html;
      index  index.html index.htm; 
                      set $flag 0;                                     #自定义变量
                     if ($document_uri ~* "regist"){       #满足条件1时$flag=01
      set $flag "${flag}1";
                          }
                    if ($request_method = POST ) {             #满足条件2时$flag=02
      set $flag "${flag}2";
                          }
                        if ($flag = "012"){                         #同时满足条件1和2时
      dynamic_limit_req zone=sms burst=3 nodelay;      #当1分钟内达到3个请求时
      dynamic_limit_req_status 403;                               #被拦截时返回状态
                        }
                        if ($document_uri ~* "getSmsVerifyCode.do"){
                                   #当url含有#getSmsVerifyCode.do限制成1分钟内最多5个请求
      dynamic_limit_req zone=sms burst=5 nodelay;
      dynamic_limit_req_status 444;                               #被拦截时返回状态
                  }
      dynamic_limit_req zone=two burst=50 nodelay mail_to=**@qq.com api_max=200 ;
      dynamic_limit_req_status 403;                               #被拦截时返回状态
              }
      ```
      
      ------
      
      第一个条件:页面为regist且方法为POST,当用户访问http://node2.nginx.org/a/regist时进行注册账户,并且1分钟内达到3次就会激活拦截动作,随后注册者IP就会被拦截。
      
      第二个条件:当请求getSmsVerifyCode.do发送短信验证码接口时,若1分钟内达到5次,注册者IP就会被拦截。
      
      第三个条件:node2.nginx.org全局任意页面只要超过每秒50个请求就会被拦截。
      
      这里只是静态页面,而当Nginx反向代理后端服务时,比如tomcat、iis、apache服务时可参考如下配置,如果不想每个Server设置筛选条件则可以在HTTP中设置。配置如下:
      
      ------
      
      ```
      . . .
      http {
      . . .
      dynamic_limit_req_zone $binary_remote_addr zone=one:10m rate=100r/s
      redis=127.0.0.1 block_second=600;
      dynamic_limit_req zone=one burst=80 nodelay;
      dynamic_limit_req_status 403;
      . . .
      server1
      . . .
      }
      server2
      . . .
      }
      . . .
      server {
      listen       *:80;
      server_name  node3.nginx.org;
      location / {
      proxy_set_header   Host    $host;
      proxy_set_header   X-Real-IP $server_addr;
      proxy_set_header   REMOTE-HOST $remote_addr;
      proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
      proxy_pass http://127.0.0.1:8080/;
                      }
      error_page   500 502 503 504  /50x.html;
      location = /50x.html {
      root   html;
                      }
              }
      }
      ```
      
      ------
      
      关于模块的代码实现细节,将在第11章Nginx高级主题中进行详细讲解。
      

RedisPushIptables模块

  1. 本章首先介绍RedisPushIptables模块的实现原理、安装方法、API使用方法及适用范围,并将RedisPushIptables模块与Fail2ban进行对比,以便读者了解二者的区别。RedisPushIptables不受编程语言的限制,意味着开发者都可以使用它进行业务防护。接着将讲解怎样重新封装lib库从而支持API调用,最后会给出部分编程语言调用API的示例,供读者参阅。

  2. RedisPushIptables是Redis的一个模块,目前支持iptables、PF、nftables防火墙和ipset工具,也可以把它理解为防火墙的API调用库。RedisPushIptables模块可以通过Redis来操作iptables的Filter表INPUT链规则ACCEPT和DROP,而相对于BSD系统,该模块则是对应PF防火墙。

  3. RedisPushIptables更新防火墙规则以在指定的时间内拒绝IP地址或永远拒绝,比如用来防御攻击。自此普通开发者也可以使用iptables或者PF,而不必再理会复杂的防火墙语法。

  4. RedisPushIptables与Fail2Ban比较,从两个方面将RedisPushIptables与Fail2Ban进行比较:实现原理和性能。Fail2Ban倾向于事后分析,需要监控日志,支持的应用也比较多,只需简单配置即可。而RedisPushIptables倾向于实效性,不需要监控日志,但是需要程序编码时调用API,使用门槛较高,并不适用所有人。

    1. Fail2Ban的特征
      1. Fail2Ban是一种入侵防御软件框架,可以保护计算机服务器免受暴力攻击。其用Python编程语言编写,能够在POSIX系统上运行。POSIX系统具有本地安装的数据包控制系统或防火墙的接口,例如iptables或TCP Wrapper。
      2. Fail2ban通过监控操作日志文件(如/var/log/auth.log、/var/log/apache/access.log等)选中条目并运行基于它们的脚本,常用于阻止可能试图破坏系统安全性的IP地址。它可以在管理员定义的时间范围内,禁止进行过多登录尝试或执行任何其他不需要的操作的IP地址,包括对IPv4和IPv6的支持,可选择更长时间的禁令然后为不断滥用者进行定制配置。
      3. Fail2Ban通常设置为在一定时间内阻止和取消恶意IP,几分钟的unban时间通常足以阻止网络连接被恶意连接淹没,并降低字典攻击成功的可能性。
      4. 每当检测到滥用的IP地址时,Fail2Ban都可以执行多个操作:更新Netfilter/iptables或PF防火墙规则,TCP Wrapper的hosts.deny表,拒绝滥用者的IP地址、邮件通知或者可以由Python脚本执行的任何用户定义的操作。
      5. Fail2Ban的标准配置附带Apache、Lighttpd、sshd、vsftpd、qmail、Postfix和Courier Mail Server的过滤器。过滤器是被Python定义的正则表达式,其可以由熟悉正则表达式的管理员方便地定制。过滤器和操作的组合称为jail,它能阻止恶意主机访问指定的网络服务。除了随软件一起分发的示例之外,还可以为任何创建访问日志文件的面向网络的进程创建jail。
      6. Fail2Ban类似于DenyHosts[…],但与专注于SSH的DenyHosts不同,Fail2Ban可以配置为监视将登录尝试写入日志文件的任何服务,而不是仅使用/etc/hosts.deny来阻止IP地址/hosts,Fail2Ban可以使用Netfilter/iptables和TCP Wrappers/etc/hosts.deny。
      7. Fail2Ban的缺点如下:Fail2Ban无法防范分布式暴力攻击;没有与特定于应用程序的API的交互;太过依赖正则表达式,不同的程序需要各自对应的正则;效率低下,性能受日志数量影响;当IP列表很多时,内存消耗很高。
    2. RedisPushIptables的特征
      1. 虽然与Fail2Ban比较,RedisPushIptables的支持还不是很完善,但术业有专攻,它的优势在于高性能,用C语言实现,同样支持跨平台Linux、BSD、Mac OS,可以通过API调用,意味着Redis官方支持的编程语言都可以使用,应用范围不受限。
      2. Fail2Ban是被动防御攻击的,因为它需要匹配字符串再计算阈值,如果满足条件才会封禁IP地址;而RedisPushIptables属于主动调用,不需要分析日志。RedisPushIptables同样支持动态删除iptables或者PF规则,比Fail2ban更省资源。
      3. RedisPushIptables的缺点如下:需要开发者在编码时调用API;无法防范分布式暴力攻击;目前IPv6在我国还没普及所以不支持。
  5. 安装RedisPushIptables,在安装RedisPushIptables之前,需要先安装Redis。下面为安装redis-5.0.3.tar.gz版本:

    root@debian:~/bookscode#git clone https://github.com/limithit/RedisPushIptables.git
    root@debian:~/bookscode# wget http://download.redis.io/releases/redis-
    5.0.3.tar.gz
    root@debian:~/bookscode# tar zxvf redis-5.0.3.tar.gz
    root@debian:~/bookscode#cd redis-5.0.3&& make               #编译
    root@debian:~/bookscode/redis-5.0.3# make test                #测试
    root@debian:~/bookscode/redis-5.0.3/deps/hiredis#make&& make install
                                                                                          #编译和安装
    root@debian:~/bookscode/redis-5.0.3/src#cpredis-serverredis-sentinelredis-
    cliredis-benchmarkredis-check-rdbredis-check-aof /usr/local/bin/
                                                                #复制编译好的程序到/usr/local/bin/下
    root@debian:~/bookscode/redis-5.0.3/utils# ./install_server.sh
                                                                                            #执行安装脚本
    root@debian:~/bookscode/redis-5.0.3# cd deps/hiredis
    root@debian:~/bookscode/redis-5.0.3/deps/hiredis# make && make install
    root@debian:~/bookscode/redis-5.0.3#echo /usr/local/lib >> /etc/ld.so.conf
                                                                                          #添加动态库变量
    root@debian:~/bookscode/redis-5.0.3# ldconfig             #加载库变量配置
    root@debian:~/bookscode# cd RedisPushIptables
    root@debian:~/bookscode/ RedisPushIptables # make   && make install编译并安装
    
    
    注意:目前最新版本为RedisPushIptables-6.2.tar.gz。编译时有4个选项,分别是make、make CFLAGS=-DWITH_IPSET、make CFLAGS=-DWITH_NFTABLES和make CFLGAS=-DBSD。其中,Linux系统默认是make即启用iptables防火墙,make CFLAGS=-DWITH_IPSET则是使用ipset更快地管理规则,make CFLAGS=-DWITH_NFTABLES则是使用nftables防火墙,make CFLGAS=-DBSD则是在BSD和Mac OS系统上默认编译使用。
    
    如果想更快地管理iptables规则,可以使用ipset工具,具体如下:
    
    ------
    
    ```
    root@debian:~/bookscode# cd RedisPushIptables
    root@debian:~/bookscode/ RedisPushIptables # make CFLAGS=-DWITH_IPSET
                                                                                                      #编译
    root@debian:~/bookscode/ RedisPushIptables # make install             #安装文件
    ```
    
    ------
    
    然后进行如下配置:
    
    ------
    
    ```
    #ipset create block_ip hash:ip timeout 60 hashsize 4096 maxelem 10000000
    #创建用于存储DROP IP的Hash可存放10万IP地址
    #iptables -I INPUT -m set --match-set block_ip src -j DROP
    #ipset create allow_ip hash:ip hashsize 4096 maxelem 10000000
    #创建用于存储DROP IP的Hash可存放10万IP地址
    #iptables -I INPUT -m set --match-set allow_ip src -j ACCEPT
    ```
    
    ------
    
    需要注意的是,timeout参数与ttl_drop_insert参数具有相同的效果。如果timeout配置了参数,则使用ipset实现定期删除;如果未配置timeout参数,则使用定期删除ttl_drop_insert。
    
    如果用户想使用nftables防火墙,则需要以下步骤:
    
    ------
    
    ```
    root@debian:~/bookscode# cd RedisPushIptables
    root@debian:~/bookscode/ RedisPushIptables # make CFLAGS=-DWITH_NFTABLES
                                                                                                      #编译
    root@debian:~/bookscode/ RedisPushIptables # make install        #安装文件
    ```
    
    ------
    
    然后进行如下配置:
    
    ------
    
    ```
    #nft add table redis                                                                     #创建表
    #nft add chain redis INPUT \{ type filter hook input priority 0\; policy
    accept\; \}                                                                               #创建链
    ```
    
    ------
    
    以上三种是在Linux系统下启用不同防火墙或管理工具的方法。
    
    下面讲解在Mac OS、Freebsd、Openbsd、Netbsd和Solaris下安装软件包的方法,因为这5个操作系统都支持Packet Filter(也叫PF)防火墙。步骤如下:
    
    ------
    
    ```
    #1: 编译hiredis
        cd redis-4.0**version**/deps/hiredis
        make 
        make install 
      #2: git clone  https://github.com/limithit/RedisPushIptables.git
                                                                                                      #下载源码
        cd RedisPushIptables
        make                                                                                    #编译
        make install                                                                         #安装
    ```
    
    ------
    
    首先编辑/etc/pf.conf文件并添加配置,配置内容如下:
    
    ------
    
    ```
    table <block_ip> persist file "/etc/pf.block_ip.conf"
    table <allow_ip> persist file "/etc/pf.allow_ip.conf"
    block in log proto {tcp,udp,sctp,icmp} from <block_ip> to any
    pass in proto {tcp,udp,sctp,icmp} from <allow_ip> to any
    ```
    
    ------
    
    然后输入以下命令:
    
    ------
    
    ```
    # touch /etc/pf.block_ip.conf                      #创建block文件
    # touch /etc/pf.allow_ip.conf                      #创建allow文件
    # pfctl -F all -f /etc/pf.conf                  #清空之前规则并加载新的规则
    # pfctl -e                                                 #启用PF防火墙
    ```
    
    ------
    
    BSD系统不提供启动脚本,不管是安装Linux系统或者BSD系统,最后都要通过Redis加载模块提供API。可以使用以下redis.conf配置指令加载模块:
    
    ------
    
    ```
    loadmodule /path/to/iptablespush.so
    ```
    
    ------
    
    也可以使用以下命令在运行时加载模块:
    
    ------
    
    ```
    MODULE LOAD /path/to/iptablespush.so
    ```
    
    ------
    
    使用以下命令卸载模块:
    
    ------
    
    ```
    MODULE unload iptables-input-filter
    ```
    
    ------
    
    
    
  6. 动态删除配置

    1. 1. 默认情况下,Redis是禁用键空间事件通知的,原因是该功能会消耗CPU。通过redis.conf配置notify-keyspace-events参数或CONFIG SET可以启用通知,将该参数设置为空字符串会禁用通知。为了启用该功能,notify-keyspace-events使用了一个非空字符串,其由多个字符组成,每个字符都具有特殊含义,具体如下:
    
    ------
    
    ```
    K     Keyspace events, published with __keyspace@<db>__ prefix.
    E     Keyevent events, published with __keyevent@<db>__ prefix.
    g     Generic commands (non-type specific) like DEL, EXPIRE, RENAME, ...
    $     String commands
    l     List commands
    s     Set commands
    h     Hash commands
    z     Sorted set commands
    x     Expired events (events generated every time a key expires)
    e     Evicted events (events generated when a key is evicted for maxmemory)
    A     Alias for g$lshzxe, so that the "AKE" string means all the events.
    ```
    
    ------
    
    字符串中至少应存在K或E,否则无论如何字符串的其余部分都不会传递任何事件。例如,只为列表启用键空间事件,配置参数必须设置为Kl,以此类推。字符串KEA可用于启用每个可能的事件。例如:
    
    ------
    
    ```
    # redis-cli config set notify-keyspace-events Ex
    ```
    
    ------
    
    也可以使用以下redis.conf配置指令加载模块:
    
    ------
    
    ```
    notify-keyspace-events Ex
    #notify-keyspace-events ""                    #注释掉这行
    ```
    
    ------
    
    使用root用户运行ttl_iptables守护程序:
    
    ------
    
    ```
    root@debian:~/RedisPushIptables# /etc/init.d/ttl_iptables start
    ```
    
    ------
    
    在/var/log/ttl_iptables.log中查看日志:
    
    ------
    
    ```
    root@debian:~# redis-cli TTL_DROP_INSERT 192.168.18.5 60
    (integer) 12
    root@debian:~# date
    Fri Mar 15 09:38:49 CST 2019
    root@debian:~/RedisPushIptables# tail -f /var/log/ttl_iptables.log 
    2019/03/15 09:39:48 pid=5670 iptables -D INPUT -s 192.168.18.5 -j DROP
    ```
    
    ------
    
    
    
    
    
  7. RedisPushIptables指令

    RedisPushIptables目前由5个指令来管理filter表中的INPUT链。为了保证规则生效,采用了插入规则而不是按序添加规则,这么做是因为iptables是按顺序执行的。此外,RedisPushIptables加入了自动去重功能(ipset和pfctl自带去重),使用者不必担心会出现重复的规则,只需要添加即可。
    
    ·accept_insert:等同iptables-I INPUT-s x.x.x.x-j ACCEPT;
    
    ·accept_delete:等同iptables-D INPUT-s x.x.x.x-j ACCEPT;
    
    ·drop_insert:等同iptables-I INPUT-s x.x.x.x-j DROP;
    
    ·drop_delete:等同iptables-D INPUT-s x.x.x.x-j DROP;
    
    ·ttl_drop_insert:等同iptables-I INPUT-s x.x.x.x-j DROP。等待60秒后ttl_iptables守护进程就会自动删除iptables-D INPUT-s x.x.x.x-j DROP,例ttl_drop_insert192.168.18.560。
    
  8. 客户端API示例

    1. 理论上除了C语言原生支持API调用以外,其他语言API调用前对应的库都要重新封装,因为第三方模块并不被其他语言所支持。这里只示范C、Python、Bash和Lua语言,其他编程语言同理。

      1. C语言编程

        C语言只需要编译安装hiredis即可。如下:
        
        ------
        
        ```
        root@debian:~/bookscode/redis-5.0.3/deps/hiredis#make install
        ```
        
        ------
        
        下面是一个C语言版本的API调用示例源代码example.c:
        
        ------
        
        ```
        #include <stdio.h>
        #include <stdlib.h>
        #include <string.h>
        #include <hiredis.h>
        int main(int argc, char **argv) {
            unsigned int j;                                        /* 声明redis变量*/
            redisContext *c;
            redisReply *reply;
            const char *hostname = (argc > 1) ? argv[1] : "127.0.0.1";
                                                                                          /*获取连接地址*/
            int port = (argc > 2) ? atoi(argv[2]) : 6379;       /* 获取redis端口*/
            struct timeval timeout = { 1, 500000 }; // 1.5 seconds
                                                                                        /*连接超时时间*/
        c = redisConnectWithTimeout(hostname, port, timeout);
        /* 如果连接失败则退出并打印错误提示*/
            if (c == NULL || c->err) {
                if (c) {
        printf("Connection error: %s\n", c->errstr);
                    redisFree(c);
                } else {
        printf("Connection error: can't allocate redis context\n");
                }
        exit(1);
        }
        /*执行drop.insert指令等同iptables -I INPUT -S 192.168.18.3 -j DROP */
           reply = redisCommand(c,"drop_insert 192.168.18.3");
        printf("%d\n", reply->integer);
        freeReplyObject(reply);                                            /*释放reply结果*/
        /*执行accept.insert指令等同iptables -I INPUT -S 192.168.18.3 -j ACCEPT */
         reply = redisCommand(c,"accept_insert 192.168.18.4");
        printf("%d\n", reply->integer);
        freeReplyObject(reply);
        /*执行drop.delete指令等同iptables -D INPUT -S 192.168.18.3 -j DROP */
           reply = redisCommand(c,"drop_delete 192.168.18.3");
        printf("%d\n", reply->integer);
            freeReplyObject(reply);
        /*执行accept.delete指令等同iptables -D INPUT -S 192.168.18.3 -j ACCEPT */
         reply = redisCommand(c,"accept_delete 192.168.18.5");
        printf("%d\n", reply->integer);
            freeReplyObject(reply);
            redisFree(c);
            return 0;
        }
        ```
        
        ------
        
        之后使用编译器GCC编译并链接hiredis动态库,生成可执行文件:
        
        ------
        
        ```
        # gcc example.c-  I/usr/local/include/hiredis -lhiredis
        ```
        
        ------
        
        
        
      2. Python语言编程

        Python语言是Linux系统中经常使用的编程语言,通常是在系统管理员日常工作中常用的脚本语言,所以这里也给出API的调用示例如下:
        
        ------
        
        ```
        root@debian:~/bookscode# git clone https://github.com/andymccurdy/redis-
        py.git                                                                   #下载Python lib库
        ```
        
        ------
        
        下载完之后不要急着安装,先编辑redis-py/redis/client.py文件,添加代码如下:
        
        ------
        
        ```
        # COMMAND EXECUTION AND PROTOCOL PARSING
         def execute_command(self, *args, **options):
              "Execute a command and return a parsed response"
               .....
               .....
         def drop_insert(self, name):
             """
             Return the value at key ``name``, or None if the key doesn't exist
              """
             return self.execute_command('drop_insert', name)
         def accept_insert(self, name):
             """
             Return the value at key ``name``, or None if the key doesn't exist
            """
             return self.execute_command('accept_insert', name)
         def drop_delete(self, name):
             """
             Return the value at key ``name``, or None if the key doesn't exist
             """
             return self.execute_command('drop_delete', name)
         def accept_delete(self, name):
             """
             Return the value at key ``name``, or None if the key doesn't exist
             """
             return self.execute_command('accept_delete', name)
         def ttl_drop_insert(self, name, blocktime):
             """
         Return the value at key ``name``, or None if the key doesn't exist
             """
             return self.execute_command('ttl_drop_insert', name, blocktime)
        ```
        
        ------
        
        为了不误导读者,上述代码没有加注释,只是在类里添加了几个函数,不需要解释。下面安装修改后的库测试命令调用。
        
        ------
        
        ```
        root@debian:~/bookscode/redis-py# python setup.py build            #编译
        root@debian:~/bookscode/redis-py# python setup.py install          #安装
        root@debian:~/bookscode/8/redis-py# python
        Python 2.7.3 (default, Nov 19 2017, 01:35:09) 
        [GCC 4.7.2] on linux2
        Type "help", "copyright", "credits" or "license" for more information.
        >>> import redis
        >>> r = redis.Redis(host='localhost', port=6379, db=0)
        >>>r.drop_insert('192.168.18.7')
        12L
        >>>r.accept_insert('192.168.18.7')
        12L
        >>>r.accept_delete('192.168.18.7')
        0L
        >>>r.drop_delete('192.168.18.7')
        0L
        >>> r.ttl_drop_insert('192.168.18.7', 600)
        12L
        >>>
        ```
        
        ------
        
      3. Bash语言编程

        同Python语言一样,shell语言也应该是系统管理员必须会的。shell可以完成其他高级语言不擅长的事情。比如过滤/var/log/nginx/access.log中请求量最大的前10位IP,并将它们动态封禁1天;再如用inotifywait检测sshd的日志,日志一旦有变动就进行累加,最后调用命令封禁,都可以当做是用shell实现fail2ban的功能。简单的示例examples.sh如下:
        #!/bin/bash
        #循序插入254个IP测试执行速度,一分钟后自动删除添加的规则
        for ((i=1; i<=254; i++))
         do
        redis-cli TTL_DROP_INSERT 192.168.17.$i 60 
        done  
        redis-cli DROP_INSERT 192.168.18.5 
        redis-cli DROP_DELETE 192.168.18.5 
        redis-cli ACCEPT_INSERT 192.168.18.5
        redis-cli ACCEPT_DELETE 192.168.18.5
        
      4. Lua语言编程

        在第5章中在介绍Web防火墙类型的时候提及过关于Lua脚本实现的Web防火墙,还有些CDN系统也是用Lua实现的,所以这里介绍下Lua如何通过API调用防火墙,从而达到应用层和网络层联动效果的。先下载Lua:
        
        ------
        
        ```
        git clone https://github.com/nrk/redis-lua.git             #下载Lua lib库
        ```
        
        ------
        
        下载后编辑redis-lua/src/redis.lua,添加以下代码:
        
        ------
        
        ```
        redis.commands = {
            ……
            ttl              = command('TTL'),
            drop_insert     = command('drop_insert'),
            drop_delete     = command('drop_delete'),
            accept_insert    = command('accept_insert'),
            accept_delete    = command('accept_delete'),
            ttl_drop_insert  = command('ttl_drop_insert'),
            pttl             = command('PTTL'),         -- >= 2.6
            ……
        ```
        
        ------
        
        示例代码examples.lua如下:
        
        ------
        
        ```
        package.path = "../src/?.lua;src/?.lua;" .. package.path
        pcall(require, "luarocks.require")             --不要忘记安装Luasocket库
        local redis = require 'redis'
        local params = {
            host = '127.0.0.1',
            port = 6379,
        }
        local client = redis.connect(params)                     -- 连接redis
        client:select(0) -- for testing purposes                   -- 选择db0库
        client:drop_insert('192.168.1.1')            -- 等同iptables -I INPUT -s 
                                                                        192.168.1.1 -j DROP
        client:drop_delete('192.168.1.1')           --同上
        client:ttl_drop_insert('192.168.1.2', '60')      --加入规则60秒后自动删除添
                                                                                    加的规则
        local value = client:get('192.168.1.2')
        print(value)
        ```
        
        ------
        
        用户需要与业务结合,才能最大化地发挥RedisPushIptables模块的作用。比如与第7章ngx_dynamic_limit_req?_module结合,可以做到应用层条件匹配、网络层拦截。在这之前虽然应用层也可以拦截,但是依旧会消耗网络和系统资源等,而网络层联动拦截就不存这些问题。在第9章中将会把这些模块组合起来,从而构建自己的Web应用防火墙。
        

构建自己的WAF

  1. 本章大部分以实战为主,结合了应用层、网络层和传输层进行协同防御,在面对不同的攻击类型时要学习分析攻击特征,灵活地调整防御方案。在网络攻防中,没有绝对安全的系统,强如微软、iOS系统也是在不断地修复漏洞。软件总会有Bug,了解了攻击原理后修复即可。同时,本章也是本书最重要的内容,即如何构建Web应用防火墙。

  2. 一款完善的Web应用防火墙,除了基础的Web防护外,还应该具有CC防护、接口防刷、IP动态封锁、HTTP-flood和恶意IP永久封禁等功能。当然,仅仅组合起来还不能达到需求,还需要添加些许代码经过简单地改动即可实现。接下来进行实战演练。

  3. 恶意IP的定义为长时间地对Web页面进行SQL和XSS等渗透扫描。常见的扫描器有SQLMap和BurpSuite等。

  4. 安装所需软件:nginx-1.15.8.tar.gz\ngx_dynamic_limit_req_module\Naxsi.

    tar zxvf nginx-1.15.8.tar.gz									# 解压缩
    cd nginx-1.15.8													# 进入目录
    ./configure--prefix=/usr/local/nginx --with-http_ssl_module --add-module=../ngx_dynamic_limit_req_module --add-module=../naxsi/naxsi_src                                       # 编译配置
    make -j4                										# 编译
    make install            										# 安装
    
  5. 参数配置

    复制Naxsi核心规则到Nginx目录下:
    
    ------
    
    ```
    cp naxsi/naxsi_config/naxsi_core.rules /usr/local/nginx/conf/
    ```
    
    ------
    
    为了方便管理,创建naxsi.rules:
    
    ------
    
    ```
    root@debian:~/bookscode/9# touch /usr/local/nginx/conf/naxsi.rules
    root@debian:~/bookscode/9# cat /usr/local/nginx/conf/naxsi.rules 
    LearningMode;                                           #启用学习模式,生成白名单之后再关闭
    SecRulesEnabled;                                       #启用Naxsi
    DeniedUrl "/403.html";                           #当被拦截时的提示页
    ## check rules
    CheckRule "$SQL >= 8" BLOCK;                     #打开SQL注入拦截
    CheckRule "$RFI >= 8" BLOCK;                #打开远程文件包含拦截
    CheckRule "$TRAVERSAL >= 4" BLOCK;            #打开目录遍历拦截
    CheckRule "$EVADE >= 4" BLOCK;               #打开逃避拦截
    CheckRule "$XSS >= 8" BLOCK;                  #打开跨站拦截
    ```
    
    ------
    
    配置文件nginx.conf增加的内容如下:
    
    ------
    
    ```
    . . .
    http {
    . . .
    include naxsi_core.rules;                      #加载Naxsi核心规则
    include conf.d/*.conf;
    dynamic_limit_req_zone $binary_remote_addr zone=one:10m rate=100r/s redis=
    127.0.0.1 block_second=600;            #当单个IP每秒请求大于80个时就锁定此IP 10分钟
    dynamic_limit_req zone=one burst=80 nodelay;
    dynamic_limit_req_status 403;
    . . .
    server {
    listen       *:80;
    server_name  node3.nginx.org;
    location / {
    include naxsi.rules;                                 #拦截规则
    include /usr/local/nginx/conf/node3.nginx.org.rules;             #白名单
    access_log  logs/node3.nginx.org.log;
       error_log logs/node3.nginx.org_error.log;
    proxy_set_header   Host    $host;
    proxy_set_header   X-Real-IP $server_addr;
    proxy_set_header   REMOTE-HOST $remote_addr;
    proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_pass http://192.168.18.1:85/;
                    }
    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
    root   html;
                    }
            }
    }
    ```
    
    ------
    
    创建用于存储node3.nginx.org站点的Naxsi白名单:
    
    ------
    
    ```
    root@debian:~/bookscode/9# touch /usr/local/nginx/conf/node3.nginx.org.rules
    root@debian:~/bookscode/9# /usr/local/nginx/sbin/nginx –t      #检测配置是否有错误
    nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
    nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
    root@debian:~/bookscode/9# /usr/local/nginx/sbin/nginx      #启动Nginx
    ```
    
    ------
    
    这时已经完成了Naxsi的配置及启动,之后只需要学习模式生成白名单即可。打开浏览器,单击Web页面所有的功能选项以生成学习日志,最后根据日志再生成白名单,步骤如下:
    
    ------
    
    ```
    root@debian:/usr/local/nginx/logs# tail -f node3.nginx.org_error.log
    2019/03/11 11:04:50 [error] 24815#0: *105 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=93&total_blocked=8&block=1&cscore0=$XSS&score0=8&zone0=
    ARGS|NAME&id0=1310&var_name0=files%5B%5D&zone1=ARGS|NAME&id1=1311&var_
    name1=files%5B%5D, client: 192.168.16.120, server: node3.nginx.org, request:
    "GET /jsLoader.php?ver=2.4.1&lang=en_GB&showGuiMessaging=1&files[]=
    servercheck.js HTTP/1.1", host: "node3.nginx.org", referrer: http://node3.
    nginx.org/hostgroups.php?sid=2bb28e3e535c5412
    2019/03/11 11:04:50 [error] 24815#0: *108 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=97&total_blocked=9&block=1&cscore0=$XSS&score0=8&zone0=ARGS|NAME&id0=
    1310&var_name0=files%5B%5D&zone1=ARGS|NAME&id1=1311&var_name1=files%5B%5D,
    client: 192.168.16.120, server: node3.nginx.org, request: "GET /jsLoader.
    php?ver=2.4.1&lang=en_GB&showGuiMessaging=1&files[]=servercheck.js HTTP/1.1",
    host: "node3.nginx.org", referrer: "http://node3.nginx.org/report1.php?sid=
    2bb28e3e535c5412"
    2019/03/11 11:04:51 [error] 24815#0: *105 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=101&total_blocked=10&block=1&cscore0=$XSS&score0=8&zone0=ARGS|
    NAME&id0=1310&var_name0=files%5B%5D&zone1=ARGS|NAME&id1=1311&var_name1=
    files%5B%5D, client: 192.168.16.120, server: node3.nginx.org, request:
    "GET /jsLoader.php?ver=2.4.1&lang=en_GB&showGuiMessaging=1&files[]=
    servercheck.js HTTP/1.1", host: "node3.nginx.org", referrer: "http://node3.
    nginx.org/hostinventoriesoverview.php?sid=2bb28e3e535c5412"
    2019/03/11 11:04:54 [error] 24815#0: *141 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=105&total_blocked=11&block=1&cscore0=$XSS&score0=8&zone0=ARGS|
    NAME&id0=1310&var_name0=files%5B%5D&zone1=ARGS|NAME&id1=1311&var_name1=
    files%5B%5D, client: 192.168.16.120, server: node3.nginx.org, request: 
    "GET /jsLoader.php?ver=2.4.1&lang=en_GB&showGuiMessaging=1&files[]=
    servercheck.js HTTP/1.1", host: "node3.nginx.org", referrer: "http://node3.
    nginx.org/overview.php?ddreset=1&sid=2bb28e3e535c5412"
    2019/03/11 11:04:55 [error] 24815#0: *141 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=111&total_blocked=12&block=1&cscore0=$SQL&score0=4&cscore1=
    $XSS&score1=16&zone0=ARGS&id0=1000&var_name0=files%5B%5D&zone1=ARGS|
    NAME&id1=1310&var_name1=files%5B%5D&zone2=ARGS|NAME&id2=1311&var_name2=
    files%5B%5D&zone3=ARGS|NAME&id3=1310&var_name3=files%5B%5D&zone4=ARGS|
    NAME&id4=1311&var_name4=files%5B%5D, client: 192.168.16.120, server: node3.
    nginx.org, request: "GET /jsLoader.php?ver=2.4.1&lang=en_GB&showGuiMessaging=
    1&files[]=multiselect.js&files[]=servercheck.js HTTP/1.1", host: "node3.nginx.org",
    referrer: "http://node3.nginx.org/latest.php?ddreset=1&sid=2bb28e3e535c5412"
    2019/03/11 11:04:56 [error] 24815#0: *141 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=1&vers=0.56&total_
    processed=118&total_blocked=13&block=1&cscore0=$XSS&score0=16&zone0=ARGS|
    NAME&id0=1310&var_name0=files%5B%5D&zone1=ARGS|NAME&id1=1311&var_name1=
    files%5B%5D&zone2=ARGS|NAME&id2=1310&var_name2=files%5B%5D&zone3=ARGS|
    NAME&id3=1311&var_name3=files%5B%5D, client: 192.168.16.120, server: node3.
    nginx.org, request: "GET /jsLoader.php?ver=2.4.1&lang=en_GB&showGuiMessaging=
    1&files[]=class.cswitcher.js&files[]=servercheck.js HTTP/1.1", host: "node3.
    nginx.org", referrer: "http://node3.nginx.org/tr_status.php?ddreset=1&sid=
    2bb28e3e535c5412"
    ```
    
    ------
    
    Word格式与终端里看到的可能有所差别。当learning=1时为学习模式,即使触发了拦截规则,也不会被阻止。
    
    
    
  6. 白名单生成

    白名单生成需要把日志加载到ElasticSearch里再使用nxtool工具生成。根据笔者测试发现,ElasticSearch版本不能太高,否则将无法兼容nxtool工具。这里推荐读者使用elasticsearch-2.3.5版本,具体如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# tar zxvf elasticsearch-2.3.5.tar.gz
    -C /home/
    root@debian:~/bookscode/9/naxsi/nxapi# useradd -d /home/elasticsearch-2.3.5/
    user2                                                                  #创建用户
    root@debian:~/bookscode/9/naxsi/nxapi# chown -R user2.user2 /home/elasticsearch-
    2.3.5/                                                                  #更改权限
    root@debian:~/bookscode/9/naxsi/nxapi# su user2
                                                      #切换用户,因为ElasticSearch不能以root运行
    $ cd ~                                                              #回到用户的home目录
    $ bin/elasticsearch –d                                          #以daemon模式启动
    $ netstat -tupln|grep 9200                                     #说明已经启动成功了
    (Not all processes could be identified, non-owned process info
     will not be shown, you would have to be root to see it all.)
    tcp6              0      0 127.0.0.1:9200            :::*            LISTEN   27326/java
    tcp6               0       0 ::1:9200                   :::*            LISTEN   27326/java
    $ exit                                                                   #回到root用户
    root@debian:~/bookscode/9/naxsi/nxapi# curl -XPUT 'http://localhost:9200/
    nxapi/'                                                             #创建索引
    ```
    
    ------
    
    把日志加载到ElasticSearch 中:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./nxtool.py -c  nxapi.json
    --files=/usr/local/nginx/logs/node3.nginx.org_error.log
    # size :1000
    Unable to create the index/collection : nxapi events, Error: create() takes
    at least 5 arguments (5 given)
    WARNING:root:Python's GeoIP module is not present.
                'World Map' reports won't work,
                and you can't use per-country filters.
    Unable to get GeoIP
    WARNING:root:List of files :['/usr/local/nginx/logs/node3.nginx.org_error.log']
    log open
    {'date': '2019-03-11T11:04:27+08', 'events': [{'zone': 'ARGS|NAME', 'ip':
    '192.168.16.120', 'uri': '/jsLoader.php', 'server': 'node3.nginx.org',
    'content': '', 'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:
    04:27+08', 'id': '1310'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120',
    'uri': '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '', 
    'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:04:27+08',
    'id': '1311'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120', 'uri':
    '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '', 'var_name':
    'files[]', 'country': '', 'date': '2019-03-11T11:04:27+08', 'id': '1310'},
    {'zone': 'ARGS|NAME', 'ip': '192.168.16.120', 'uri': '/jsLoader.php',
    'server': 'node3.nginx.org', 'content': '', 'var_name': 'files[]','country':
    '', 'date': '2019-03-11T11:04:27+08', 'id': '1311'}]}
    {'date': '2019-03-11T11:04:46+08', 'events': [{'zone': 'ARGS|NAME', 'ip':
    '192.168.16.120', 'uri': '/jsLoader.php', 'server': 'node3.nginx.org',
    'content': '', 'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:
    04:46+08', 'id': '1310'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120',
    'uri': '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '',
    'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:04:46+08',
    'id': '1311'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120', 'uri':
    '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '', 'var_name':
    'files[]', 'country': '', 'date': '2019-03-11T11:04:46+08', 'id': '1310'},
    {'zone': 'ARGS|NAME', 'ip': '192.168.16.120', 'uri': '/jsLoader.php',
    'server': 'node3.nginx.org', 'content': '', 'var_name': 'files[]', 'country':
    '', 'date': '2019-03-11T11:04:46+08', 'id': '1311'}]}
    {'date': '2019-03-11T11:04:47+08', 'events': [{'zone': 'ARGS|NAME', 'ip':
    '192.168.16.120', 'uri': '/jsLoader.php', 'server': 'node3.nginx.org',
    'content': '', 'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:
    04:47+08', 'id': '1310'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120',
    'uri': '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '',
    'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:04:47+08',
    'id': '1311'}]}
    {'date': '2019-03-11T11:04:48+08', 'events': [{'zone': 'ARGS|NAME', 'ip':
    '192.168.16.120', 'uri': '/jsLoader.php', 'server': 'node3.nginx.org',
    'content': '', 'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:
    04:48+08', 'id': '1310'}, {'zone': 'ARGS|NAME', 'ip': '192.168.16.120',
    'uri': '/jsLoader.php', 'server': 'node3.nginx.org', 'content': '',
    'var_name': 'files[]', 'country': '', 'date': '2019-03-11T11:04:48+08',
    'id': '1311'}]}
    ……#日志过多省略
    Written 51 events
    ```
    
    ------
    
    列出日志中出现的域名和URL:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./nxtool.py -c nxapi.json -x --colors
    # size :1000
    # Whitelist(ing) ratio :
    # false 50.0% (total:51/102)
    # Top servers :
    Host nginx.org 100.0% (total:51/51)
    Host node3 100.0% (total:51/51)
    # Top URI(s) :
    ### jsloader.php 100.0% (total:51/51)
    # Top Zone(s) :
    # args 100.0% (total:51/51)
    # name 98.04% (total:50/51)
    # Top Peer(s) :
    # 192.168.16.120 100.0% (total:51/51)
    ```
    
    ------
    
    根据域名和URL后缀生成白名单:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./nxtool.py -c nxapi.json –colors
    -s nginx.org -f --filter 'uri 'jsloader.php'' --slack
    # size :1000
    #  template :tpl/APPS/google_analytics-ARGS.tpl 
    Nb of hits : 0
    #  template :tpl/URI/site-wide-id.tpl 
    Nb of hits : 0
    #  template :tpl/URI/global-url-0x_in_pircutres.tpl 
    Nb of hits : 0
    #  template :tpl/URI/url-wide-id.tpl 
    Nb of hits : 0
    #  template :tpl/ARGS/site-wide-id.tpl 
    Nb of hits : 51
    #  template matched, generating all rules.
    3 whitelists ...
    #msg: A generic, wide (id+zone) wl
    #Rule (1310) open square backet ([), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1310 "mz:ARGS";                             #白名单
    #msg: A generic, wide (id+zone) wl
    #Rule (1311) close square bracket (]), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1311 "mz:ARGS";                               #白名单
    #msg: A generic, wide (id+zone) wl
    #Rule (1000) sql keywords
    #total hits 1
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1000 "mz:ARGS";                          #白名单
    #  template :tpl/ARGS/url-wide-id-NAME.tpl 
    Nb of hits : 51
    #  template matched, generating all rules.
    3 whitelists ...
    #msg: A generic whitelist, true for the whole uri
    #Rule (1310) open square backet ([), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1310 "mz:$URL:jsloader.php|ARGS|NAME";                     #白名单
    #msg: A generic whitelist, true for the whole uri
    #Rule (1311) close square bracket (]), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1311 "mz:$URL:jsloader.php|ARGS|NAME";                 #白名单
    #msg: A generic whitelist, true for the whole uri
    #Rule (1000) sql keywords
    #total hits 1
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1000 "mz:$URL:jsloader.php|ARGS|NAME";                #白名单
    #  template :tpl/ARGS/precise-id.tpl 
    Nb of hits : 51
    #  template matched, generating all rules.
    3 whitelists ...
    #msg: A generic, precise wl tpl (url+var+id)
    #Rule (1310) open square backet ([), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1310 "mz:$URL:jsloader.php|$ARGS_VAR:files";          #白名单
    #msg: A generic, precise wl tpl (url+var+id)
    #Rule (1311) close square bracket (]), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1311 "mz:$URL:jsloader.php|$ARGS_VAR:files";            #白名单
    #msg: A generic, precise wl tpl (url+var+id)
    #Rule (1000) sql keywords
    #total hits 1
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1000 "mz:$URL:jsloader.php|$ARGS_VAR:files";            # 白名单
    #  template :tpl/ARGS/url-wide-id.tpl 
    Nb of hits : 51
    #  template matched, generating all rules.
    3 whitelists ...
    #msg: A generic whitelist, true for the whole uri
    #Rule (1310) open square backet ([), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1310 "mz:$URL:jsloader.php|ARGS";                           # 白名单
    #msg: A generic whitelist, true for the whole uri
    #Rule (1311) close square bracket (]), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1311 "mz:$URL:jsloader.php|ARGS";                          #白名单
    #msg: A generic whitelist, true for the whole uri
    #Rule (1000) sql keywords
    #total hits 1
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1000 "mz:$URL:jsloader.php|ARGS";                      #白名单
    #  template :tpl/HEADERS/cookies.tpl 
    Nb of hits : 0
    #  template :tpl/BODY/site-wide-id.tpl 
    Nb of hits : 0
    #  template :tpl/BODY/url-wide-id-BODY-NAME.tpl 
    Nb of hits : 50
    #  template matched, generating all rules.
    2 whitelists ...
    #msg: A generic whitelist, true for the whole uri, BODY|NAME
    #Rule (1310) open square backet ([), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1310 "mz:$URL:jsloader.php|BODY|NAME";                     #白名单
    #msg: A generic whitelist, true for the whole uri, BODY|NAME
    #Rule (1311) close square bracket (]), possible js
    #total hits 25
    #peers : 192.168.16.120
    #uri : /jsLoader.php
    #var_name : files[]
    BasicRule  wl:1311 "mz:$URL:jsloader.php|BODY|NAME";                    #白名单
    #  template :tpl/BODY/var_name-wide-id.tpl 
    Nb of hits : 0
    #  template :tpl/BODY/precise-id.tpl 
    Nb of hits : 0
    #  template :tpl/BODY/url-wide-id.tpl 
    Nb of hits : 0
    ```
    
    ------
    
    以BasicRule开头的就是白名单,为了看得更清楚,可以通过管道过滤下注释的提示:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./nxtool.py -c nxapi.json –colors
    -s nginx.org -f --filter 'uri 'jsloader.php'' --slack|grep BasicRule
    BasicRule  wl:1310 "mz:ARGS";
    BasicRule  wl:1311 "mz:ARGS";
    BasicRule  wl:1000 "mz:ARGS";
    BasicRule  wl:1310 "mz:$URL:jsloader.php|ARGS|NAME";
    BasicRule  wl:1311 "mz:$URL:jsloader.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:jsloader.php|ARGS|NAME";
    BasicRule  wl:1310 "mz:$URL:jsloader.php|$ARGS_VAR:files";
    BasicRule  wl:1311 "mz:$URL:jsloader.php|$ARGS_VAR:files";
    BasicRule  wl:1000 "mz:$URL:jsloader.php|$ARGS_VAR:files";
    BasicRule  wl:1310 "mz:$URL:jsloader.php|ARGS";
    BasicRule  wl:1311 "mz:$URL:jsloader.php|ARGS";
    BasicRule  wl:1000 "mz:$URL:jsloader.php|ARGS";
    BasicRule  wl:1310 "mz:$URL:jsloader.php|BODY|NAME";
    BasicRule  wl:1311 "mz:$URL:jsloader.php|BODY|NAME";
    ```
    
    ------
    
    最后将其添加到/usr/local/nginx/conf/node3.nginx.org.rules文件中:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./nxtool.py -c nxapi.json –colors
    -s node3.nginx.org  -f --filter 'uri 'jsloader.php'' --slack|grep BasicRule
    >/usr/local/nginx/conf/node3.nginx.org.rules
    ```
    
    ------
    
    上述Server配置到Naxsi白名单生成的操作就介绍完了,但手动操作有些复杂,时间久了也许会忘记步骤,所以需要写一个脚本使其自动化生成。
    
  7. 白名单自动化生成

    把不同的项目全部放到conf.d目录下面以方便管理,而每一个项目则是一个单独的xx.conf文件,比如node3.nginx.org.conf的配置如下:
    
    ------
    
    ```
    server {
    listen       *:80;
    server_name  node3.nginx.org;
    location / {
    include learning.rules;                                       #拦截规则
    include conf.d/node3.nginx.org.rules;                   #白名单
    access_log  logs/node3.nginx.org.log;
       error_log logs/node3.nginx.org_error.log;
    proxy_set_header   Host    $host;
    proxy_set_header   X-Real-IP $server_addr;
    proxy_set_header   REMOTE-HOST $remote_addr;
    proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_pass http://192.168.18.1:85/;
                    }
    error_page   500 502 503 504  /50x.html;
    location = /50x.html {
    root   html;
                    }
            }
    ```
    
    ------
    
    创建学习模式的配置文件learning.rules,之后重新加载nginx.conf,如下:
    
    ------
    
    ```
    root@debian:/usr/local/nginx/conf# cp naxsi.rules learning.rules
                                                                   #复制一份并重命名为learning.rules
    root@debian:/usr/local/nginx/conf# sed -i 1d learning.rules      #删除第1行
    root@debian:/usr/local/nginx/conf# diff -y naxsi.rules learning.rules
                                                                   #比对两者的区别
    #LearningMode;                              <
    SecRulesEnabled;                              SecRulesEnabled;
    DeniedUrl "/403.html";                              DeniedUrl "/403.html";
    ## check rules                                    ## check rules
    CheckRule "$SQL >= 8" BLOCK;                        CheckRule "$SQL >= 8" BLOCK;
    CheckRule "$RFI >= 8" BLOCK;                        CheckRule "$RFI >= 8" BLOCK;
    CheckRule "$TRAVERSAL >= 4" BLOCK;                  CheckRule "$TRAVERSAL >= 4"BLOCK;
    CheckRule "$EVADE >= 4" BLOCK;                        CheckRule "$EVADE >= 4" BLOCK;
    CheckRule "$XSS >= 8" BLOCK;                        CheckRule "$XSS >= 8" BLOCK;
    root@debian:/usr/local/nginx/conf# mkdir auto conf.d
    ```
    
    ------
    
    创建两个脚本如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# cat rule.sh 
    #!/bin/sh
    set -x                                                         #打开调试
    if [ $# -ne 1 ]                                             #当参数少于1个时退出
    then
    echo  "Usage: ./autorule.sh /paths/logs/path.log"
    exit 1
    fi
    curl -XPUT 'http://localhost:9200/nxapi/'      #添加索引然后删除在此之前的记录
    curl -XDELETE 'http://localhost:9200/nxapi/' -d '{
    "query" : { 
        "match_all" : {}
    }
    }'
    log_file="/tmp/generate.log"
    exec 1>> "${log_file}"
    exec 2>> "${log_file}"
    naxsi_log=/usr/local/nginx/logs/${1}_error.log
    nxtool.py -c nxapi.json  --files=$naxsi_log
    sleep 1
    nxtool.py -c nxapi.json -x --colors |grep '###' | awk '{print $2}' > url
    servers=$(nxtool.py -c nxapi.json -x  --colors  |grep Host |awk '{print $2}')
     cat url |while read line
         do
    nxtool.py -c nxapi.json --colors  -s $servers -f --filter 'uri '$line''
    --slack |grep BasicRule >> ruletmp
       done
    if [ -f ruletmp ]
    then 
    sed  -i 's/URL:/URL:\//g' ruletmp                  #去掉重复的规则
    cat ruletmp|sort|uniq >>/usr/local/nginx/conf/conf.d/${1}.rules && rm -rf ruletmp
    fi
    /usr/local/nginx/auto/learning_switch.sh naxsi ${1}
                                                                            #调用另一个脚本关闭学习模式
    return 0
    ```
    
    ------
    
    接下来是用来切换学习模式的脚本:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# cat /usr/local/nginx/conf/auto/
    learning_switch.sh 
    #!/bin/bash
    set -x 
    if [ $# -ne 2 ]
    then
     echo "Usage: naxsi/learning servername"
    exit 1
    fi
    if [ "${1}" = "learning" ]                  #当传递的字符为learning时则打开学习模式,
                                                              否则关闭学习模式
    then
    sed -i 's/naxsi/learning/' /usr/local/nginx/conf/conf.d/${2}.conf
    else 
    sed -i 's/learning/naxsi/' /usr/local/nginx/conf/conf.d/${2}.conf
    fi
    /usr/local/nginx/sbin/nginx -s reload
    ```
    
    ------
    
    最后改动nxtool.py中的一行代码,大约在第295行,将
    
    ------
    
    ```
    print '# {0} {1} {2}{3}'.format(translate.grn.format(list_e[0]),
    list_e[1], list_e[2], list_e[3])
    ```
    
    ------
    
    改成:
    
    ------
    
    ```
    print '### {0} {1} {2}{3}'.format(translate.grn.format(list_e[0]),
    list_e[1], list_e[2], list_e[3])
    ```
    
    ------
    
    多加了两个##符号,是为了配合脚本过滤。准备工作已经做完,完整地浏览一遍网页以便生成日志。把每个功能使用一次,以Zabbix2.4为例,结果如图9.1所示。
    
    [![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/9t1.jpg)](http://popImage?src='../Images/9t1.jpg')
    
    图9.1 Zabbix示例
    
    在生成白名单之前,也就是使用rule.sh脚本之前,查看以下配置:
    
    ------
    
    ```
    root@debian:/usr/local/nginx/conf/auto# cat /usr/local/nginx/conf/conf.d/
    node3.nginx.org.conf 
    server {
        listen       *:80;
        server_name  node3.nginx.org;
          location / {
        include learning.rules;                                    #学习模式
        include conf.d/node3.nginx.org.rules;             #白名单
        access_log  logs/node3.nginx.org.log;            #单独记录访问日志
        error_log logs/node3.nginx.org_error.log;      #单独记录错误日志也是拦截日志
        proxy_set_header   Host    $host;                 #反向代理传递$host参数
        proxy_set_header   X-Real-IP $server_addr;      #反向代理传递$server_addr参数
        proxy_set_header   REMOTE-HOST $remote_addr;      # 反向代理传递$remote_addr
                                                                                  参数
        proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
                                                                             #传递转发的IP
        proxy_pass http://192.168.18.1:85/;
                    }
        error_page   500 502 503 504  /50x.html;            #错误提示页
        location = /50x.html {
        root   html;
                    }
            }
    #此时为空
    root@debian:/usr/local/nginx/conf/auto# cat /usr/local/nginx/conf/conf.d/
    node3.nginx.org.rules
    ```
    
    ------
    
    执行rule.sh脚本传递参数为域名node3.nginx.org:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# ./rule.sh node3.nginx.org
    + [ 1 -ne 1 ]
    + curl -XPUT http://localhost:9200/nxapi/
    {"error":{"root_cause":[{"type":"index_already_exists_exception","reason":
    "already exists","index":"nxapi"}],"type":"index_already_exists_exception",
    "reason":"already exists","index":"nxapi"},"status":400}+ curl –XDELETE
    http://localhost:9200/nxapi/ -d {
    "query" : { 
        "match_all" : {}
    }
    }
    {"acknowledged":true}+ log_file=/tmp/generate.log
    + exec
    + exec
    ```
    
    ------
    
    再次查看配置文件learning.rules,已经替换成了naxsi.rules,也就是关闭了学习模式,步骤如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# cat /usr/local/nginx/conf/conf.d/
    node3.nginx.org.conf 
    server {
        listen       *:80;
        server_name  node3.nginx.org;
          location / {
        include naxsi.rules;                                 #拦截规则
        include conf.d/node3.nginx.org.rules;       #白名单
        access_log  logs/node3.nginx.org.log;      #上面已经解释过了,这里不再赘述每行
                                                                           的意思
        error_log logs/node3.nginx.org_error.log;
        proxy_set_header   Host    $host;
        proxy_set_header   X-Real-IP $server_addr;
        proxy_set_header   REMOTE-HOST $remote_addr;
        proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_pass http://192.168.18.1:85/;
                    }
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
        root   html;
                    }
            }
    ```
    
    ------
    
    查看白名单已经生成,规则适用Zabbix2.4.1,规则如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/naxsi/nxapi# cat /usr/local/nginx/conf/conf.d/
    node3.nginx.org.rules 
    BasicRule  wl:1000 "mz:ARGS";
    BasicRule  wl:1000 "mz:BODY";
    BasicRule  wl:1000 "mz:$BODY_VAR:esc_step_from";
    BasicRule  wl:1000 "mz:$BODY_VAR:form";
    BasicRule  wl:1000 "mz:$BODY_VAR:insert";
    BasicRule  wl:1000 "mz:$BODY_VAR:new_operation";
    BasicRule  wl:1000 "mz:$BODY_VAR:update";
    BasicRule  wl:1000 "mz:$URL:/actionconf.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/actionconf.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/actionconf.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/actionconf.php|$BODY_VAR:esc_step_from";
    BasicRule  wl:1000 "mz:$URL:/actionconf.php|$BODY_VAR:new_operation";
    BasicRule  wl:1000 "mz:$URL:/discoveryconf.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/discoveryconf.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/discoveryconf.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/discoveryconf.php|$BODY_VAR:update";
    BasicRule  wl:1000 "mz:$URL:/hosts.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/hosts.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/hosts.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/hosts.php|$BODY_VAR:update";
    BasicRule  wl:1000 "mz:$URL:/httpconf.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/httpconf.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/httpconf.php|$BODY_VAR:form";
    BasicRule  wl:1000 "mz:$URL:/jsloader.php|ARGS";
    BasicRule  wl:1000 "mz:$URL:/jsloader.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/jsloader.php|$ARGS_VAR:files";
    BasicRule  wl:1000 "mz:$URL:/popup_httpstep.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup_httpstep.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/popup_httpstep.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup_httpstep.php|$BODY_VAR:update";
    BasicRule  wl:1000 "mz:$URL:/popup.php|ARGS";
    BasicRule  wl:1000 "mz:$URL:/popup.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup.php|$ARGS_VAR:multiselect";
    BasicRule  wl:1000 "mz:$URL:/popup.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup_trexpr.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup_trexpr.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/popup_trexpr.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/popup_trexpr.php|$BODY_VAR:insert";
    BasicRule  wl:1000 "mz:$URL:/profile.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/profile.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/profile.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/profile.php|$BODY_VAR:update";
    BasicRule  wl:1000 "mz:$URL:/triggers.php|ARGS|NAME";
    BasicRule  wl:1000 "mz:$URL:/triggers.php|BODY";
    BasicRule  wl:1000 "mz:$URL:/triggers.php|BODY|NAME";
    BasicRule  wl:1000 "mz:$URL:/triggers.php|$BODY_VAR:update";
    ```
    
    ------
    
    需要说明的是,读者不要误以为每个URL地址都要一条白名单规则,比如:
    
    ------
    
    ```
    http://monitor.tsou.cn/hosts.php?ddreset=1&sid=9f8ddfcc66328443
    http://monitor.tsou.cn/hosts.php?ddreset=2&sid=9f8ddfcc66328445
    ```
    
    ------
    
    这只需要一条规则即可,因为它是相同的参数、不同的值而已。
    
    ------
    
    ```
    http://monitor.tsou.cn/hosts.php?ddreset=3&sid=9f8ddfcc66328443<>
    ```
    
    ------
    
    此时就需要新加一条规则,因为URL包含了字符“<>”,它触发了拦截,规则如下:
    
    ------
    
    ```
    BasicRule  wl:1001 "mz:BODY";
    BasicRule  wl:1001 "mz:$BODY_VAR:2";
    BasicRule  wl:1001 "mz:$BODY_VAR:dchecks";
    BasicRule  wl:1001 "mz:$BODY_VAR:name";
    BasicRule  wl:1001 "mz:$URL:/discoveryconf.php|BODY";
    BasicRule  wl:1001 "mz:$URL:/discoveryconf.php|BODY|NAME";
    BasicRule  wl:1001 "mz:$URL:/discoveryconf.php|$BODY_VAR:2";
    BasicRule  wl:1001 "mz:$URL:/discoveryconf.php|$BODY_VAR:dchecks";
    BasicRule  wl:1001 "mz:$URL:/discoveryconf.php|$BODY_VAR:name";
    BasicRule  wl:1008 "mz:BODY";
    BasicRule  wl:1008 "mz:$BODY_VAR:agent";
    BasicRule  wl:1008 "mz:$URL:/httpconf.php|BODY";
    BasicRule  wl:1008 "mz:$URL:/httpconf.php|BODY|NAME";
    BasicRule  wl:1008 "mz:$URL:/httpconf.php|$BODY_VAR:agent";
    BasicRule  wl:1009 "mz:ARGS";
    BasicRule  wl:1009 "mz:BODY";
    BasicRule  wl:1009 "mz:$BODY_VAR:expr_type";
    BasicRule  wl:1009 "mz:$URL:/dashboard.php|ARGS";
    BasicRule  wl:1009 "mz:$URL:/dashboard.php|ARGS|NAME";
    BasicRule  wl:1009 "mz:$URL:/popup_trexpr.php|BODY";
    BasicRule  wl:1009 "mz:$URL:/popup_trexpr.php|BODY|NAME";
    BasicRule  wl:1009 "mz:$URL:/popup_trexpr.php|$BODY_VAR:expr_type";
    BasicRule  wl:1010 "mz:ARGS";
    BasicRule  wl:1010 "mz:BODY";
    BasicRule  wl:1010 "mz:$BODY_VAR:r_longdata";
    BasicRule  wl:1010 "mz:$URL:/actionconf.php|BODY";
    BasicRule  wl:1010 "mz:$URL:/actionconf.php|BODY|NAME";
    BasicRule  wl:1010 "mz:$URL:/actionconf.php|$BODY_VAR:r_longdata";
    BasicRule  wl:1010 "mz:$URL:/popup_trexpr.php|ARGS";
    BasicRule  wl:1010 "mz:$URL:/popup_trexpr.php|ARGS|NAME";
    BasicRule  wl:1010 "mz:$URL:/popup_trexpr.php|$ARGS_VAR:expression";
    BasicRule  wl:1011 "mz:ARGS";
    BasicRule  wl:1011 "mz:BODY";
    BasicRule  wl:1011 "mz:$BODY_VAR:def_longdata";
    BasicRule  wl:1011 "mz:$BODY_VAR:message";
    BasicRule  wl:1011 "mz:$BODY_VAR:new_operation";
    BasicRule  wl:1011 "mz:$BODY_VAR:opmessage";
    BasicRule  wl:1011 "mz:$BODY_VAR:r_longdata";
    BasicRule  wl:1011 "mz:$URL:/actionconf.php|BODY";
    BasicRule  wl:1011 "mz:$URL:/actionconf.php|BODY|NAME";
    BasicRule  wl:1011 "mz:$URL:/actionconf.php|$BODY_VAR:def_longdata";
    BasicRule  wl:1011 "mz:$URL:/actionconf.php|$BODY_VAR:message";
    BasicRule  wl:1011 "mz:$URL:/actionconf.php|$BODY_VAR:new_operation";
    ……省略
    ```
    
    ------
    
    由于只是示范性说明,这里就不列出完整的白名单了。至此,白名单自动化生成就实现了。在工作中建议实现一个Web管理后台进行操作,用户只需要添加域名和后端代理地址即可。
    
    
    
  8. 整合Fail2ban

    虽然Naxsi可以在应用层拦截储如SQL注入、XSS、命令注入等攻击,可是攻击依然会消耗Nginx资源。当这种攻击放大几百倍时就演变成了HTTP-flood攻击,也就是应用层的DDoS,怎么办?这时就需要应用层结合网络层和传输层协同防御。示例配置如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9# git clone https://github.com/fail2ban/fail2ban.git
                                                                                      #下载fail2ban
    root@debian:~/bookscode/9# cd fail2ban
    root@debian:~/bookscode/9/fail2ban# python setup.py build            #编译
    root@debian:~/bookscode/9/fail2ban# python setup.py install            #安装
    root@debian:~/bookscode/9/fail2ban# cp files/debian-initd /etc/init.d/
                                                                                   #复制启动脚本到init.d
    ```
    
    ------
    
    创建/etc/fail2ban/filter.d/nginx-naxsi.conf并添加以下内容:
    
    ------
    
    ```
    root@debian:~/bookscode/9/fail2ban# vim /etc/fail2ban/filter.d/nginx-naxsi.conf
    [INCLUDES]
    before = common.conf
    [Definition]
    failregex = NAXSI_FMT: ip=<HOST>&server=.*&uri=.*&learning=0
                NAXSI_FMT: ip=<HOST>.*&config=block
    ignoreregex = NAXSI_FMT: ip=<HOST>.*&config=learning
    ```
    
    ------
    
    编辑/etc/fail2ban/jail.conf 添加以下内容:
    
    ------
    
    ```
    root@debian:~/bookscode/9/fail2ban# vim /etc/fail2ban/jail.conf
    [nginx-naxsi]
    enabled = true
    port = http,https
    filter = nginx-naxsi
    logpath = /usr/local/nginx/logs/*error.log
    maxretry = 6
    ```
    
    ------
    
    当某个IP在/usr/local/nginx/logs/node3.nginx.org_error.log中连续出现6次并且learning=0不是学习模式时,就用iptables封禁此IP来访问80和443端口,10分钟后再放行。演示如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/fail2ban# tail -f /var/log/fail2ban.log
                                                                                             #查看日志
    2019-03-12 09:11:00,278 fail2ban.filter         [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120 - 2019-03-12 09:11:00
    2019-03-12 09:11:00,304 fail2ban.observer       [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120, bad - 2019-03-12 09:11:00, 1 # -> 2
    2019-03-12 09:11:06,885 fail2ban.filter         [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120 - 2019-03-12 09:11:06
    2019-03-12 09:11:06,931 fail2ban.observer       [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120, bad - 2019-03-12 09:11:06, 1 # -> 2
    2019-03-12 09:11:08,087 fail2ban.filter         [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120 - 2019-03-12 09:11:07
    2019-03-12 09:11:08,098 fail2ban.observer       [430]: INFO    [nginx-naxsi]
    Found 192.168.16.120, bad - 2019-03-12 09:11:07, 1 # -> 2
    2019-03-12 09:11:08,398 fail2ban.actions        [430]: NOTICE  [nginx-naxsi]
    Ban 192.168.16.120
    2019-03-12 09:21:07,243 fail2ban.actions        [430]: NOTICE  [nginx-naxsi]
    Unban 192.168.16.120
    ```
    
    ------
    
    此时会发现6次后这个IP就被禁止了,可以通iptables-L-n查看:
    
    ------
    
    ```
    root@debian:~/bookscode/9/fail2ban# iptables -L -n
    Chain INPUT (policy ACCEPT)
    target     prot opt source             destination         
    f2b-nginx-naxsi  tcp  --  0.0.0.0/0      0.0.0.0/0      multiport dports 80,443
    Chain FORWARD (policy ACCEPT)
    target     prot opt source             destination         
    Chain OUTPUT (policy ACCEPT)
    target     prot opt source             destination         
    Chain f2b-nginx-naxsi (1 references)
    target     prot opt source             destination         
    REJECT     all  --  192.168.16.120      0.0.0.0/0      reject-with icmp-port-unreachable
    RETURN     all  --  0.0.0.0/0            0.0.0.0/0
    ```
    
    ------
    
    可能会遇到一些错误,这是因为iptables版本太低,不支持-w选项,升级一下即可,错误提示如下:
    
    ------
    
    ```
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: #39-Lev. 7fb8d95b56f0
    -- exec: iptables -w -N f2b-nginx-naxsi
    iptables -w -A f2b-nginx-naxsi -j RETURN
    iptables -w -I INPUT -p tcp -m multiport --dports http,https -j f2b-nginx-naxsi
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0
    -- stderr: 'iptables v1.4.14: unknown option "-w"'
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0
    -- stderr: "Try `iptables -h' or 'iptables --help' for more information."
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0
    -- stderr: 'iptables v1.4.14: unknown option "-w"'
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0
    -- stderr: "Try `iptables -h' or 'iptables --help' for more information."
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0
    -- stderr: 'iptables v1.4.14: unknown option "-w"'
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0 
    -- stderr: "Try `iptables -h' or 'iptables --help' for more information."
    2019-03-11 17:46:54,809 fail2ban.utils          [430]: ERROR   7fb8d95b56f0 
    -- returned 2
    2019-03-11 17:46:54,809 fail2ban.actions        [430]: ERROR   Failed to 
    execute ban jail 'nginx-naxsi' action 'iptables-multiport' info 'ActionInfo
    ({'ip': '192.168.16.120', 'fid': <function <lambda> at 0x7fb8d96689b0>,
    'family': 'inet4', 'raw-ticket': <function <lambda> at 0x7fb8d9668f50>})':
    Error starting action Jail('nginx-naxsi')/iptables-multiport
    ```
    
    ------
    
    至此fail2ban已经配置完成且启用了,但熟悉它的用户应该知道,Fail2ban的拦截规律是连续性的攻击才会被触发。就比如刚才我们设置的触发条件,当某个IP在日志中连续出现6次且learning=0不是学习模式时才会在iptables封禁,假如出现5次触发攻击之后夹杂1次正常请求,此时Fail2ban就显得苍白无力了。因为攻击者很狡猾,不达目的不罢休。下面的一节内容将弥补Fail2ban的这个不足,使用定制开发Naxsi来实现。
    
  9. 定制开发Naxsi

    此次需要用MySQL、RedisIptablesPush、ngx_dynamic_limit_req_module来完善前面所说的Fail2ban的不足。在这之前其他模块都已相继在前面的章节中介绍并且使用过了,这里不再赘述。首先建立表结构来存储Naxsi攻击数据,如下:
    
    ------
    
    ```
    -- ----------------------------
    -- Table structure for naxsi_attack_log
    -- ----------------------------
    DROP TABLE IF EXISTS `naxsi_attack_log`;
    CREATE TABLE `naxsi_attack_log` (
      `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
      `ip` varchar(50) DEFAULT NULL COMMENT '攻击者IP',
      `server` varchar(255) DEFAULT NULL COMMENT '攻击域名',
      `attack_type` varchar(24) DEFAULT NULL COMMENT '攻击类型',
      `score` int(255) DEFAULT NULL,
      `url` char(255) DEFAULT NULL,
      `at` datetime NOT NULL COMMENT '创建时间',
      `is_send` int(10) DEFAULT '10' COMMENT '这个字段读者可忽略,因为这是项目中使
                                                                     用到的,书中不会用到该字段',
      PRIMARY KEY (`id`),
      KEY `host` (`ip`,`at`) USING BTREE
    ) ENGINE=InnoDB AUTO_INCREMENT=404009 DEFAULT CHARSET=utf8;
    ```
    
    ------
    
    用diff命令生成path文件:
    
    ------
    
    ```
    root@debian:~/bookscode/9/stable/naxsi-0.56rc1/naxsi_src# diff –Naur
    naxsi_runtime.c /root/naxsi/naxsi_src/naxsi_runtime.c > patch.mysql
    ```
    
    ------
    
    利用patch文件和patch命令打补丁:
    
    ------
    
    ```
    root@debian:~/bookscode/9/stable/naxsi-0.56rc1/naxsi_src# patch -p1
    naxsi_runtime.c <patch.mysql
    ```
    
    ------
    
    补丁内容如下:
    
    ------
    
    ```
    root@debian:~/bookscode/9/stable/naxsi-0.56rc1/naxsi_src# cat patch.mysql
      1 --- naxsi_runtime.c     2017-11-06 18:54:53.000000000 +0800
      2 +++ /root/naxsi/naxsi_src/naxsi_runtime.c       2019-03-12 14:37:18.662527670
        +0800
      3 @@ -29,7 +29,9 @@
      4   * along with this program.  If not, see <http://www.gnu.org/licenses/>.
      5   */
      6  #include "naxsi.h"
      7 -
      8 +#include <mysql.h>
      9 +#include <hiredis/hiredis.h>
     10 +static int content_type_filter = 0;
     11  /* used to store locations during the configuration time. 
     12     then, accessed by the hashtable building feature during "init" time. */
     13 
     14 @@ -796,13 +798,19 @@
     15    ngx_http_dummy_loc_conf_t    *cf;
     16    ngx_http_matched_rule_t      *mr;
     17    char          tmp_zone[30];
     18 -
     19 +  char sql[4096], lock_host[2048];
     20 +  MYSQL_RES *res_ptr;
     21 +
     22    cf = ngx_http_get_module_loc_conf(r, ngx_http_naxsi_module);
     23 
     24    tmp_uri = ngx_pcalloc(r->pool, sizeof(ngx_str_t));
     25    if (!tmp_uri)
     26      return (NGX_ERROR);
     27    *ret_uri = tmp_uri;
     28 +
     29 +  if (r->uri.len  >= (NGX_MAX_UINT32_VALUE/4)-1) {
     30 +    r->uri.len /= 4;
     31 +  }
     32 
     33    tmp_uri->len = r->uri.len + (2 * ngx_escape_uri(NULL, r->uri.data,
           r->uri.len,
     34                                                   NGX_ESCAPE_ARGS));
     35 @@ -819,16 +827,24 @@
     36    sub = offset = 0;
     37    /* we keep extra space for seed*/
     38    sz_left = MAX_LINE_SIZE - MAX_SEED_LEN - 1;
     39 -
     40 +
     41 +
     42    /* 
     43    ** don't handle uri > 4k, string will be split
     44    */
     45 +
     46 +
     47    sub = snprintf((char *)fragment->data, sz_left, fmt_base, r->
           connection->addr_text.len,
     48                  r->connection->addr_text.data,
     49                  r->headers_in.server.len, r->headers_in.server.data,
     50                  tmp_uri->len, tmp_uri->data, ctx->learning ?1 : 0,
                         strlen(NAXSI_VERSION),
     51                  NAXSI_VERSION, cf->request_processed, cf->request_blocked,
                         ctx->block ?1 : (ctx->drop ? 1 : 0));
     52 -
     53 +
     54 +       char Host[256];
     55 +       const char *fmt_base2 = "%.*s";
     56 +       snprintf((char *) Host, sizeof(Host), fmt_base2,
     57 +                       r->connection->addr_text.len, r->connection->
                                 addr_text.data);
     58 +
     59    if (sub >= sz_left)
     60      sub = sz_left - 1;
     61    sz_left -= sub;
     62 @@ -863,8 +879,53 @@
     63         sub = sz_left - 1;
     64        offset += sub;
     65        sz_left -= sub;
     66 +
     67 +                       snprintf(sql, sizeof(sql),
     68 +                                       "insert into naxsi_attack_log values
                                                (NULL, '%s','%s', '%s', '%zu', '%s',
                                                NOW(), 10)",
     69 +                                       (char *)Host, r->headers_in.server.
                                                 data, sc[i].sc_tag->data,
     70 +                                       sc[i].sc_score, r->request_start);
     71 +                       snprintf(lock_host, sizeof(lock_host),
     72 +                                       "SELECT * from naxsi_attack_log where
                                                ip='%s' and at >NOW()-INTERVAL 5
                                                MINUTE having count(*) >60",
     73 +                                       (char *) Host);
     74 +
     75 +                       if (conn_ptr) {
     76 +                               mysql_query(conn_ptr, sql);
     77 +                               mysql_query(conn_ptr, lock_host);
     78 +                               res_ptr = mysql_store_result(conn_ptr);
     79 +                               if (res_ptr) {
     80 +                                       redisContext *c;
     81 +                                       redisReply *reply;
     82 +                                       struct timeval timeout = { 1, 500000 };
                                                // 1.5 seconds
     83 +                                       c = redisConnectWithTimeout
                                                ("127.0.0.1", 6379, timeout);
     84 +                                       if (c == NULL || c->err) {
     85 +                                               redisFree(c);
     86 +                                       }
     87 +
     88 +                                       while (mysql_fetch_row(res_ptr)
                                                 &&  !c->err) {
     89 +                                               reply = redisCommand(c, "GET
                                                         white%s", Host);
     90 +                                               if (reply->str == NULL
                                                         && !ctx->learning ) {
     91 +                                               reply = redisCommand(c,
                                                         "SETEX %s %s %s", Host,
     92 +                                                               "1800",  Host);
     93 +                                                /* Increase the history
                                                          record  */
     94 +                                                reply = redisCommand
                                                          (c,"SELECT 2");
     95 +                                                reply = redisCommand(c, "SET
                                                          %s %s", Host, Host);
     96 +                                                reply = redisCommand
                                                          (c,"SELECT 0");
     97 +                                                /* Increase the history record */
     98 +                                               }
     99 +                                               freeReplyObject(reply);
    100 +                                       }
    101 +                                       if (!c->err) {
    102 +                                               redisFree(c);
    103 +                                       }
    104 +                               }
    105 +
    106 +                               mysql_free_result(res_ptr);
    107 +
    108 +                       }
    109      }
    110    }
    111 +
    112 +
    113 
           ……………………………补丁太长省略,可在线去查看,这里不再一一列出
    https://github.com/nbs-system/naxsi/compare/master...limithit:limithit-
    patch-mysql 
    304    return ;
    ```
    
    ------
    
    其中,补丁91行可以改为如下代码,从而用RedisPushIptables模块来封禁恶意IP。
    
    ------
    
    ```
    90 +               if (reply->str == NULL && !ctx->learning ) {
    91 +             reply = redisCommand(c, "drop_insert %s", Host);
    92 +                              /* iptables永久封禁*/
    93 +        /* Increase the history record  */
    ```
    
    ------
    
    或者用iptables定时封禁,例如:
    
    ------
    
    ```
    90 +               if (reply->str == NULL && !ctx->learning ) {
    91 +            reply = redisCommand(c, "ttl_drop_insert %s 600",  Host);
    92 +                              /* iptables临时封禁10分钟即600秒*/
    ```
    
    ------
    
    通过RedisPushIptables模块来调用iptables可达到网络层阻止的目的,如果读者不想改动代码,默认由应用层动态阻止1800秒,即30分钟。
    
    这个补丁实现的是把攻击日志记录在数据库中,并且会在每次攻击时,查找5分钟内达到60次攻击的IP,对其进行应用层或网络层的封禁30分钟,或者使用RedisPushIptables永久封禁。
    
    当然,这60次攻击不管是否连续,只要满足5分钟以内的时间条件,就会触发拦截。攻击记录会记录在Redis和MySQL中,需要说明的是Redis和MySQL5.6均为本机安装。如果不担心网络延时,也可以选择远程连接。
    
    修改Naxsi config文件如下:
    
    ------
    
    ```
    ngx_waf_incs="/usr/local/mysql/include"
    ngx_waf_libs="-L/usr/local/mysql/lib -lmysqlclient -lpthread -lm -lrt –ldl
    -lhiredis "
    ngx_addon_name=ngx_http_naxsi_module
    if test -n "$ngx_module_link"; then
        ngx_module_type=HTTP
        ngx_module_name=ngx_http_naxsi_module
        ngx_module_srcs="$ngx_addon_dir/naxsi_runtime.c $ngx_addon_dir/naxsi_
    config.c $ngx_addon_dir/naxsi_utils.c $ngx_addon_dir/naxsi_skeleton.c
     $ngx_addon_dir/naxsi_json.c $ngx_addon_dir/naxsi_raw.c $ngx_addon_dir/
    ext/libinjection/libinjection_sqli.c $ngx_addon_dir/ext/libinjection/
    libinjection_xss.c $ngx_addon_dir/ext/libinjection/libinjection_html5.c"
        ngx_module_libs="$ngx_waf_libs"
        ngx_module_incs="$ngx_waf_incs"
        . auto/module
    else
        HTTP_MODULES="$HTTP_MODULES ngx_http_naxsi_module"
        NGX_ADDON_SRCS="$NGX_ADDON_SRCS $ngx_addon_dir/naxsi_runtime.c $ngx_
    addon_dir/naxsi_config.c $ngx_addon_dir/naxsi_utils.c $ngx_addon_dir/
    naxsi_skeleton.c $ngx_addon_dir/naxsi_json.c $ngx_addon_dir/naxsi_raw.c
     $ngx_addon_dir/ext/libinjection/libinjection_sqli.c $ngx_addon_dir/ext/
    libinjection/libinjection_xss.c $ngx_addon_dir/ext/libinjection/
    libinjection_html5.c"
        NGX_ADDON_DEPS="$NGX_ADDON_DEPS $ngx_addon_dir/naxsi.h"
    fi
    ```
    
    ------
    
    重新编译Nginx:
    
    ------
    
    ```
    root@debian:~/bookscode/9/nginx-1.15.8#./configure--prefix=/usr/local/
    nginx --with-http_ssl_module --add-module=../ngx_dynamic_limit_req_module
     --add-module=../naxsi/naxsi_src
    root@debian:~/bookscode/9/nginx-1.15.8# make -j4
    root@debian:~/bookscode/9/nginx-1.15.8# make install
    ```
    
    ------
    
    然后先把Fail2ban关闭进行测试,用Web扫描器测试:
    
    ------
    
    ```
    root@debian:~#/etc/init.d/debian-initd stop
    root@debian:~# tail -f /usr/local/nginx/logs/node3.nginx.org_error.log 
    2019/03/12 15:54:14 [error] 11512#0: *773 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/index.php&learning=0&vers=0.56&total_processed=
    1178&total_blocked=362&block=1&cscore0=$SQL&score0=8&zone0=BODY&id0=
    1005&var_name0=request, client: 192.168.16.120, server: node3.nginx.org,
    request: "POST /index.php HTTP/1.1", host: "node3.nginx.org"
    2019/03/12 15:54:14 [error] 11512#0: *1001 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=0&vers=0.56&total_processed=
    1179&total_blocked=363&block=1&cscore0=$SQL&score0=8&cscore1=$XSS&score1=
    8&zone0=ARGS&id0=1007&var_name0=showguimessaging&zone1=ARGS&id1=1008&
    var_name1=showguimessaging, client: 192.168.16.120, server: node3.nginx.
    org, request: "GET /jsLoader.php?lang=en_gb&showGuiMessaging=
    J9gA4aMO';%20waitfor%20delay%20'0:0:7'%20--%20&ver=2.4.1 HTTP/1.1", host:
    "node3.nginx.org", referrer: "http://node3.nginx.org"
    2019/03/12 15:54:14 [error] 11512#0: *639 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/index.php&learning=0&vers=0.56&total_processed=
    1180&total_blocked=364&block=1&cscore0=$RFI&score0=8&zone0=BODY&id0=1100&
    var_name0=request, client: 192.168.16.120, server: node3.nginx.org, request:
    "POST /index.php HTTP/1.1", host: "node3.nginx.org", referrer: "http://
    node3.nginx.org"
    2019/03/12 15:54:14 [error] 11512#0: *980 NAXSI_FMT: ip=192.168.16.120&
    server=node3.nginx.org&uri=/jsLoader.php&learning=0&vers=0.56&total_processed=
    1182&total_blocked=365&block=1&cscore0=$SQL&score0=16&cscore1=$XSS&score1=
    16&zone0=ARGS&id0=1001&var_name0=ver, client: 192.168.16.120, server:
    node3.nginx.org, request: "GET /jsLoader.php?lang=en_gb&showGuiMessaging=
    1&ver=%f0''%f0%22%22 HTTP/1.1", host: "node3.nginx.org", referrer: http://
    node3.nginx.org
    ```
    
    ------
    
    然后去看Redis记录TTL为1784,时间已经过了16秒,如图9.2所示。
    
    [![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/9t2.jpg)](http://popImage?src='../Images/9t2.jpg')
    
    图9.2 key值
    
    数据库查询5分钟达到60次的记录,查询语句为SELECT*from naxsi_attack_log where ip='192.168.16.120'and at>NOW()-INTERVAL5MINUTE having count(*)>60,如图9.3所示。
    
    [![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/9t3.jpg)](http://popImage?src='../Images/9t3.jpg')
    
    图9.3 SQL查询
    
    
    
    
    
  10. Naxsi已知漏洞

    根据笔者的测试,struts2-045和struts2-046类型的攻击,Naxsi无法拦截,因为ngx_http_internal_redirect函数无法完全过滤content-type类型,会在某些情况下被绕过,如精心构造的字符串,当然这是个Bug,虽然提交了补丁给官方,但并没有被采纳。读者可以到https://github.com/limithit/naxsi/tree/limithit-patch-mysql去下载修补的版本。当然,9.6节中patch.mysql补丁里也包含了该修复。修复方法如下。
    
    naxsi_config/naxsi_core.rules加一行规则:
    
    ------
    
    ```
    MainRule "rx:%" "mz:$HEADERS_VAR:content-type" "s:DROP";
    ```
    
    ------
    
    文件naxsi_src/naxsi_runtime.c为修复content-type攻击的补丁:
    
    ------
    
    ```
    @@ -29,7 +29,7 @@
     * along with this program.  If not, see <http://www.gnu.org/licenses/>.
     */
    #include "naxsi.h"
    static int content_type_filter = 0;
    /* used to store locations during the configuration time. 
       then, accessed by the hashtable building feature during "init" time. */
    @@ -1042,6 +1042,10 @@ ngx_http_output_forbidden_page(ngx_http_request_
    ctx_t *ctx,
      else {
        ngx_http_internal_redirect(r, cf->denied_url,  
                &empty); 
        if (content_type_filter && !ctx->learning) { 
        ngx_http_finalize_request(r, NGX_HTTP_FORBIDDEN);  // struts2-045 046
    defense
          /* MainRule "rx:%" "mz:$HEADERS_VAR:content-type" "s:DROP"; */
        }
        return (NGX_HTTP_OK);
      }
      return (NGX_ERROR);
    @@ -1500,6 +1504,10 @@ ngx_http_basestr_ruleset_n(ngx_pool_t      *pool,
        if (ret == 1) {
          NX_DEBUG(_debug_basestr_ruleset, NGX_LOG_DEBUG_HTTP, req->connection->
    log, 0, 
               "XX-apply rulematch [%V]=[%V] [rule=%d] (match %d times)", name,
    value, r[i].rule_id, nb_match); 
          if (!ngx_strncasecmp((name)->data, (u_char *)"content-type", 12) 
        &&strstr((char *)(&(r[i].br->rx)->pattern)->data, "%") != NULL ) {
              content_type_filter = 1;
          }
          rule_matched = 1;
          ngx_http_apply_rulematch_v_n(&(r[i]), ctx, req, name, value, zone,
    nb_match, 0);      
        }
    ```
    
    ------
    
    接下来对含有struts2-045/046漏洞的项目进行攻击测试,来验证该补丁是否有作用。在/usr/local/nginx/conf/conf.d/下创建struts2.nginx.org.conf和struts2.nginx.org.conf.rules,如下:
    
    ------
    
    ```
    root@debian:/usr/local/nginx/conf/conf.d# cat struts2.nginx.org.conf
    server {
        listen       *:8088;
        server_name  localhost;
          location / {
        include naxsi.rules;                                             #不启用学习模式
        include conf.d/struts2.nginx.org.rules;             #白名单为空
        access_log  logs/struts2.nginx.org.log;
        error_log logs/struts2.nginx.org_error.log;
        proxy_set_header   Host    $host;
        proxy_set_header   X-Real-IP $server_addr;
        proxy_set_header   REMOTE-HOST $remote_addr;
        proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_pass http://115.236.xx.xx:8080;
                    }
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
        root   html;
                    }
            }
    ```
    
    ------
    
    重新加载Nginx:
    
    ------
    
    ```
    root@debian:/usr/local/nginx/conf/conf.d# /usr/local/nginx/sbin/nginx -s reload
    root@debian:~ # ./struts-scan.py  -u http://127.0.0.1:8088  -i struts2-045
                                                                                   #发启攻击
    shell >> pwd
    <html>
    <head><title>403 Forbidden</title></head>
    <body>
    <center><h1>403 Forbidden</h1></center>
    <hr><center>nginx/1.15.8</center>
    </body>
    </html>
    shell >>
    root@debian:~/bookscode/9# tail -f /usr/local/nginx/logs/struts2.nginx.
    org_error.log                                                             #查看日志
    2019/03/13 11:59:01 [error] 22557#0: *5 NAXSI_FMT: ip=127.0.0.1&server=
    &uri=/&learning=0&vers=0.56&total_processed=3&total_blocked=3&block=1&
    zone0=HEADERS&id0=0&var_name0=content-type, client: 127.0.0.1, server:
    localhost, request: "GET / HTTP/1.0"
    2019/03/13 11:59:01 [alert] 22557#0: *5 http request count is zero while
    sending to client, client: 127.0.0.1, server: localhost, request: "GET /
    HTTP/1.0", upstream: http://115.236.xx.xx:8080/403.html
    ```
    
    ------
    
    这么看来日志输出并不详细,加上set$naxsi_extensive_log1;参数,重新进行攻击然后再查看日志:
    
    ------
    
    ```
    server {
        listen       *:8088;
        server_name  localhost;
            set $naxsi_extensive_log 1;
          location / {
        include naxsi.rules;                                             #不启用学习模式
        include conf.d/struts2.nginx.org.rules;             #白名单为空
        access_log  logs/struts2.nginx.org.log;
        error_log logs/struts2.nginx.org_error.log;
        proxy_set_header   Host    $host;
        proxy_set_header   X-Real-IP $server_addr;
        proxy_set_header   REMOTE-HOST $remote_addr;
        proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_pass http://115.236.xx.xx:8080;
                    }
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
        root   html;
                    }
            }
    ```
    
    ------
    
    再次攻击后查看日志,其中,加粗斜体为pwd注入命令:
    
    ------
    
    ```
    root@debian:~/bookscode/9# tail -f /usr/local/nginx/logs/struts2.nginx.
    org_error.log
    2019/03/13 12:03:20 [error] 22557#0: *7 NAXSI_EXLOG: ip=127.0.0.1&server=
    &uri=%2F&id=0&zone=HEADERS&var_name=content-type&content=%25%7B%28%23nike
    %3D%27multipart%2Fform-data%27%29.%28%23dm%3D%40ognl.OgnlContext%40DEFAULT_
    MEMBER_ACCESS%29.%28%23_memberAccess%3F%28%23_memberAccess%3D%23dm%29%
    3A%28%28%23container%3D%23context%5B%27com.opensymphony.xwork2.ActionContext.
    container%27%5D%29.%28%23ognlUtil%3D%23container.getInstance%28%40com.
    opensymphony.xwork2.ognl.OgnlUtil%40class%29%29.%28%23ognlUtil.
    getExcludedPackageNames%28%29.clear%28%29%29.%28%23ognlUtil.
    getExcludedClasses%28%29.clear%28%29%29.%28%23context.setMemberAccess%
    28%23dm%29%29%29%29.%28%23cmd%3D%27pwd%27%29.%28%23iswin%3D%28%40java.
    lang.System%40getProperty%28%27os.name%27%29.toLowerCase%28%29.contains%
    28%27win%27%29%29%29.%28%23cmds%3D%28%23iswin%3F%7B%27cmd.exe%27%2C%27%
    2Fc%27%2C%23cmd%7D%3A%7B%27%2Fbin%2Fbash%27%2C%27-c%27%2C%23cmd%7D%29%
    29.%28%23p%3Dnew%20java.lang.ProcessBuilder%28%23cmds%29%29.%28%23p.
    redirectErrorStream%28true%29%29.%28%23process%3D%23p.start%28%29%29.%28
    %23ros%3D%28%40org.apache.struts2.ServletActionContext%40getResponse%28
    %29.getOutputStream%28%29%29%29.%28%40org.apache.commons.io.IOUtils%40
    copy%28%23process.getInputStream%28%29%2C%23ros%29%29.%28%23ros.flush%28
    %29%29%7D, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.0"
    2019/03/13 12:03:20 [error] 22557#0: *7 NAXSI_FMT: ip=127.0.0.1&server=
    &uri=/&learning=0&vers=0.56&total_processed=4&total_blocked=4&block=1&
    zone0=HEADERS&id0=0&var_name0=content-type, client: 127.0.0.1, server:
    localhost, request: "GET / HTTP/1.0"
    2019/03/13 12:03:20 [alert] 22557#0: *7 http request count is zero while
    sending to client, client: 127.0.0.1, server: localhost, request: "GET / 
    HTTP/1.0", upstream: http://115.236.xx.xx:8080/403.html
    ```
    
    ------
    
    接着去掉补丁,MainRule"rx:%""mz:$HEADERS_VAR:content-type""s:DROP";这条规则留着不动。重新编译后,重启Nginx而不是reload。再次发起攻击,结果如图9.4所示。
    
    [![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/9t4.jpg)](http://popImage?src='../Images/9t4.jpg')
    
    图9.4 struts攻击
    
    然后再查看攻击日志:
    
    ------
    
    ```
    root@debian:~/bookscode/9# tail -f /usr/local/nginx/logs/struts2.nginx.org_error.log
    
    ```
    
    ------
    
    可以看到日志中显示是阻止的,但在攻击端确实拿到了shell命令,说明补丁起了作用。
    
    
    
    
    
  11. 多层防御整合后对比

    1. 拆积木,牵一发而动全身。攻击者要无比小心才不会触发规则。但是,既要同时满足多种条件,又要有效率地攻击,还要不被防护者发现,几乎是不可能实现的。
    2. 假如可以实现,则需要一套分布式攻击调度程序,而且还必须要有大量代理IP地址库,不停地尝试各种Web攻击脚本。然而工作量和攻击成本之大,让大部分攻击者放弃了攻击,而坚持到最后的攻击者会发现攻击都是徒劳的,最终最原始的DDoS攻击才是最有效的。至于网络层、传输层、应用层的DDoS都可以防御,在前面章节中也均有讲解如何防御。
  12. 可能存在的瓶颈

    1. 众所周知,在多层防御整合中,仅有数据库会让人有些担忧。但有一点需要读者知道,那就是只有在攻击的情况下才会查询数据库,正常的请求(即添加白名单后)不会查询数据库。而当攻击达到一定次数时,则会被网络层iptables拦截,之后便不会再消耗数据库查询。
    2. 如果有一天遇到分布式Web攻击时,可以读写分离数据库。像CC和高并发请求,则是由ngx_dynamic_limit_req_module来处理的,也只会从Redis中查询,Redis每秒甚至可以提供100万个请求。
  13. 恶意IP库

    1. 既然创建了数据库来记录攻击者的IP地址,就可以筛选长期进行攻击的IP,这类IP可归类到恶意IP。
    2. 为什么用长期来衡量是否为恶意IP呢?因为总会有一些没有添加到白名单的URL地址也会被当成攻击来记录到数据库中。但如果持续一周或者一个月,每天有成千上万条记录,这就不是因为没有添加到白名单而引起的误报行为,理所当然地把恶意IP永久封禁,节省不必要的资源消耗。
Nginx开发指南
本章旨在向新手介绍一系列与Nginx编程有关的概念,详述HTTP请求的11个阶段,因此了解本章所涵盖的各个主题是掌握Nginx编程的先决条件。

需要说明的是,本章涉及的代码,为了不占行,均去掉了换行符。本章包含的内容有:Nginx基本概念、字符串、时间、数据结构、内存管理、日志记录、结构体、进程、线程、模块、HTTP框架及HTTP框架执行流程详解,读完本章相信读者会对Nginx认知再提升一些。最后,会发现Nginx是由多个模块构成的,而每个模块都是固定的格式。其实Nginx编程并不难,只是需要多动手实验。





## 10.1 基本概念

本节将介绍Nginx代码布局,以及在编写模块时需要包含的头文件,会尽可能的简化Nginx编程的讲解,省去繁琐的描述,直击重点,从而让读者更快速地上手Nginx编程。





### 10.1.1 源码目录

Nginx源代码目录下有auto和src目录等,因其他目录是第三方库文件,所以这里就不一一介绍了。其中,auto目录是Nginx构建时所需要的脚本,用来进行宏定义、变量检测、环境检测和系统检测等。src目录则是源代码所在的目录,其又细分为几个子目录,如core、event、http、mail、misc、os和stream。

core目录下主要提供Nginx封装的基本类型、函数、字符串、数据结构、日志和用于管理内存的pool(池)等。

event目录下提供epoll、kqueue和select事件模块,供编译时选择。http目录下则是核心模块和通用代码。mail目录下是邮件模块。os目录下是特定于某些平台的代码,如BSD、solaris和Linux等。misc目录下是最近添加的google的模块。stream目录下是用于反向代理的模块、负载均衡及其他HTTP请求阶段比较高的核心模块。Nginx目录结构如图10.1所示。

[![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/10t1.jpg)](http://popImage?src='../Images/10t1.jpg')

图10.1 Nginx目录结构



### 10.1.2 引用头文件

在程序设计中,特别是在C和C++语言中,一个头文件一般包含类、子程序、变量和其他标识符的前置声明。需要在一个以上源文件中被声明的标识符可以被放在一个头文件中,并在需要的地方包含这个头文件。通常是以源代码的形式,由编译器在处理另一个源文件的时候自动包含进来。一般来说,开发者通过include指令引入需要调用的函数原型。

以下两个#include语句必须出现在每个Nginx文件的开头,因为头文件里包含了Nginx自定义的函数和数据类型等,文件ngx_core.h、ngx_http.h、ngx_mail.h和ngx_stream.h则包含了Nginx编程中所需要的内容,这是开发者在编译第三方模块或者定制调优Nginx时必定使用的。

·#include

·#include

除此之外,HTTP代码应包括#include<ngx_http.h>语句;邮件代码应包括#include<ngx_mail.h>语句;流代码应该包括#include<ngx_stream.h>语句。





### 10.1.3 整型封装

在计算机中,整数的概念是指数学上整数的一个有限子集。它也称为整数数据类型,或简称整型数、整型。整型通常是程序设计语言的一种基础数据类型,例如,Java及C编程语言的int数据类型,然而这种基础数据类型只能表示有限的整数,其范围受制于计算机的一个字组所包含的比特数所能表示的组合总数。当运算结果超出范围时,即出现演算溢出,微处理器的状态寄存器中的溢出旗标(overflow flag)会被设置,而系统则会产生溢出异常(overflow exception)或溢出错误(overflow error)。

Nginx的代码使用了两个整数类型ngx_int_t和ngx_uint_t,它们是由intptr_t(long int)和uintptr_t(unsigned long int)定义的,在C语言中可以通typedef关键字来设定类型别名或者函数指针。下面是这两个类型由来的过程:

------

```
# define __STD_TYPE            typedef
# define __SWORD_TYPE            long int
__STD_TYPE __SWORD_TYPE __intptr_t;
typedef __intptr_t intptr_t;
typedef unsigned long int      uintptr_t;
typedef uintptr_t       ngx_uint_t;
typedef intptr_t        ngx_flag_t;
//函数指针的例子
typedef struct {
    ngx_str_t             name;
    void               *(*create_conf)(ngx_cycle_t *cycle);
    char               *(*init_conf)(ngx_cycle_t *cycle, void *conf);
} ngx_core_module_t;
```

------





### 10.1.4 函数返回值

开发者接触到的函数返回值一般是0、1、-1,而Nginx中的返回值则是有所区别的,大多数函数都返回以下值:

·NGX_OK:操作成功。

·NGX_ERROR:操作失败。

·NGX_AGAIN:操作不完整,再次调用该函数。

·NGX_DECLINED:操作被拒绝,因为它在配置中被禁用,这绝不是错误。

·NGX_BUSY:资源不可用。

·NGX_DONE:操作完成或在其他地方继续,也用作替代成功代码。

·NGX_ABORT:功能中止,也用作替代错误代码。

以上返回值在core/ngx_core.h中通过宏来定义:

------

```
#define  NGX_OK          0
#define  NGX_ERROR      -1
#define  NGX_AGAIN      -2
#define  NGX_BUSY       -3
#define  NGX_DONE       -4
#define  NGX_DECLINED   -5
#define  NGX_ABORT      -6
```

------





### 10.1.5 错误处理

ngx_socket_errno和ngx_errno宏其实是errno定义的别名,用来返回上一个系统错误的代码。errno对应POSIX平台上的errno和Windows中的GetLastError()调用,在Windows系统中则是WSAGetLastError()。下面为Nginx宏定义:

------

```
#define ngx_errno                  errno
#define ngx_socket_errno           errno
#define ngx_set_errno(err)         errno = err
#define ngx_set_socket_errno(err)  errno = err
```

------

连续多次访问ngx_errno或ngx_socket_errno的值可能会导致性能问题。如果错误值需要多次使用的话,则可以把错误值存储在ngx_err_t类型的本地变量中。要设置错误,需使用ngx_set_errno(errno)和ngx_set_socket_errno(errno)宏。ngx_errno和ngx_socket_errno的值可以传递给日志函数ngx_log_error()和ngx_log_debugX(),在这种情况下,系统错误文本将添加到日志消息中。示例如下:

------

```
   if (rc == NGX_ERROR || rc > NGX_OK || r->header_only) {
        if (ngx_close_dir(&dir) == NGX_ERROR) {
            ngx_log_error(NGX_LOG_ALERT, r->connection->log, ngx_errno,
                          ngx_close_dir_n " \"%V\" failed", &path);
        }
        return rc;
}
#define ngx_errno                  errno
```

------





## 10.2 字符串

本节将介绍Nginx特定类型的字符串ngx_str_t及用于处理字符串的函数,涉及字符串比较函数、复制函数、搜索函数、转换函数和格式化函数等,最后将介绍PCRE库中正则表达式中字符串的用法。





### 10.2.1 字符串操作

相对于C语言字符串,Nginx则使用无符号字符类型指针(u_char*)。Nginx字符串类型ngx_str_t定义如下:

------

```
typedef struct {
    size_t      len;
    u_char     *data;
} ngx_str_t;
```

------

其中,len字段保存字符串长度,data保存字符串数据。保留的字符串ngx_str_t可以在len字节之后以空值终止,也可以不以空值终止。

Nginx中的字符串操作在src/core/ngx_string.h中声明,其中一些是围绕标准C函数的别名,以下函数为部分对应参照:

·ngx_strcmp():

------

```
#define ngx_strcmp(s1, s2,)  strncmp((const char *) s1, (const char *) s2)
```

------

·ngx_strncmp():

------

```
#define ngx_strncmp(s1, s2, n)  strncmp((const char *) s1, (const char *) s2, n)
```

------

·ngx_strstr():

------

```
#define ngx_strstr(s1, s2)  strstr((const char *) s1, (const char *) s2)
```

------

·ngx_strlen():

------

```
#define ngx_strlen(s)       strlen((const char *) s)
```

------

·ngx_strchr():

------

```
#define ngx_strchr(s1, c)   strchr((const char *) s1, (int) c)
```

------

·ngx_memcmp():

------

```
#define ngx_memcmp(s1, s2, n)  memcmp((const char *) s1, (const char *) s2, n)
```

------

·ngx_memset():

------

```
#define ngx_memzero(buf, n)       (void) memset(buf, 0, n)
```

------

·ngx_memcpy():

------

```
#define ngx_memcpy(dst, src, n)   (void) memcpy(dst, src, n)
```

------

·ngx_memmove():

------

```
#define ngx_memmove(dst, src, n)   (void) memmove(dst, src, n)
```

------

其他字符串函数是特定于Nginx的:

·ngx_memzero()

------

```
#define ngx_memzero(buf, n)       (void) memset(buf, 0, n)
```

------

·ngx_cpymem():

------

```
#define ngx_cpymem(dst, src, n)   (((u_char *) ngx_memcpy(dst, src, n)) + (n))
```

------

·ngx_movemem():

------

```
#define ngx_movemem(dst, src, n)   (((u_char *) memmove(dst, src, n)) + (n))
```

------

ngx_strlchr():搜索字符串中的字符,由两个指针分隔。

以下函数为执行大小写转换和比较。

·ngx_tolower():

------

```
#define ngx_tolower(c)      (u_char) ((c >= 'A' && c <= 'Z') ? (c | 0x20) : c)
```

------

·ngx_toupper():

------

```
#define ngx_toupper(c)      (u_char) ((c >= 'a' && c <= 'z') ? (c & ~0x20) : c)
```

------

除此之外,ngx_strlow();ngx_strcasecmp()和ngx_strncasecmp()函数也具有大小写转换和比较的功能。

以下宏简化了字符串初始化:

·ngx_string(text):C字符串文字类型的静态初始化。

------

```
#define ngx_string(str)     { sizeof(str) - 1, (u_char *) str }
```

------

·ngx_null_string:静态空字符串初始化程序。

------

```
#define ngx_null_string     { 0, NULL }
```

------

·ngx_str_set(str,text):初始化字符串str的ngx_str_t*类型与C字符串文字text

------

```
#define ngx_str_set(str, text)                                               \
    (str)->len = sizeof(text) - 1; (str)->data = (u_char *) text
```

------

·ngx_str_null(str):初始化字符串str的ngx_str_t*类型与空字符串

------

```
#define ngx_str_null(str)   (str)->len = 0; (str)->data = NULL
```

------





### 10.2.2 格式化字符串

以下格式化函数支持特定于Nginx的类型:

·ngx_sprintf(buf,fmt,...)

·ngx_snprintf(buf,max,fmt,...)

·ngx_slprintf(buf,last,fmt,...)

·ngx_vslprintf(buf,last,fmt,args)

·ngx_vsnprintf(buf,max,fmt,args)

这些功能支持的格式化选项的源文件ngx_string.c位于src/core下,具体支持的格式如下:

------

```
/*
 * supported formats:
 *    %[0][width][x][X]O        off_t
 *    %[0][width]T              time_t
 *    %[0][width][u][x|X]z      ssize_t/size_t
 *    %[0][width][u][x|X]d      int/u_int
 *    %[0][width][u][x|X]l      long
 *    %[0][width|m][u][x|X]i    ngx_int_t/ngx_uint_t
 *    %[0][width][u][x|X]D      int32_t/uint32_t
 *    %[0][width][u][x|X]L      int64_t/uint64_t
 *    %[0][width|m][u][x|X]A    ngx_atomic_int_t/ngx_atomic_uint_t
 *    %[0][width][.width]f      double, max valid number fits to %18.15f
 *    %P                        ngx_pid_t
 *    %M                        ngx_msec_t
 *    %r                        rlim_t
 *    %p                        void *
 *    %V                        ngx_str_t *
 *    %v                        ngx_variable_value_t *
 *    %s                        null-terminated string
 *    %*s                       length and string
 *    %Z                        '\0'
 *    %N                        '\n'
 *    %c                        char
 *    %%                        %
 *  reserved:
 *    %t                        ptrdiff_t
 *    %S                        null-terminated wchar string
 *    %C                        wchar
 */
```

------

可以在大多数类型上添加前缀u以使其无符号。例如:

------

```
ngx_sprintf(dst, "%ud.%ud.%ud.%ud", p[12], p[13], p[14], p[15]);
```

------





### 10.2.3 数字转换函数

在Nginx中实现了几个用于数值转换的函数。前4个(ngx_atoi、ngx_atosz、ngx_atoof和ngx_atotm)函数将字符串类型转换为无符号整型,它们在出错时返回NGX_ERROR。

ngx_atoi(line,n):返回类型ngx_int_t。例如:

------

```
ngx_str_t        *value;
    *np = ngx_atoi(value[1].data, value[1].len);
```

------

ngx_atosz(line,n):返回类型ssize_t。例如:

------

```
ngx_str_t *line;
size = ngx_atosz(line->data, len);
```

------

ngx_atoof(line,n):返回类型off_t。例如:

------

```
offset = ngx_atoof(line->data, len);
```

------

ngx_atotm(line,n):返回类型time_t。例如:

------

```
u_char                       *p, *last;
time_t                        expires;
expires = ngx_atotm(p, last - p);
```

------

此外,还有两个数字转换函数,与前4个函数一样,它们在出错时将返回NGX_ERROR。

ngx_atofp(line,n,point):将给定长度的固定点浮点数转换为ngx_int_t类型的正整数,结果是左移小数点位置。数字的字符串表示形式预计不会超过小数位数,例如ngx_atofp(10.5,4,2),其返回1050。

ngx_hextoi(line,n):将正整数的十六进制表示形式转换为ngx_int_t。例如:

------

```
   u_char   *p;
ngx_hextoi(p, 2);
```

------





### 10.2.4 正则表达式

Nginx中的正则表达式接口就是PCRE库的包装,相应的头文件是src/core/ngx_regex.h。要使用正则表达式进行字符串匹配,首先需要对其进行编译,通常在配置阶段完成。注意,由于PCRE支持可选,因此使用该接口的所有代码都必须受到NGX_PCRE宏保护,示例如下:

------

```
static ngx_int_t
ngx_http_ssi_regex_match(ngx_http_request_t *r, ngx_str_t *pattern,
    ngx_str_t *str)
{
#if (NGX_PCRE)         //启用宏保护,如果启用了PCRE,则启用以下代码,否则提示错误
    int                   rc, *captures;
    u_char               *p, errstr[NGX_MAX_CONF_ERRSTR];
    size_t                size;
    ngx_str_t            *vv, name, value;
    ngx_uint_t            i, n, key;            /*
    ngx_http_ssi_ctx_t   *ctx;                  *声明变量并初始化
    ngx_http_ssi_var_t   *var;                  *
    ngx_regex_compile_t   rgc;                 */
    ngx_memzero(&rgc, sizeof(ngx_regex_compile_t));
    rgc.pattern = *pattern;
    rgc.pool = r->pool;
    rgc.err.len = NGX_MAX_CONF_ERRSTR;
    rgc.err.data = errstr;
        /* 匹配字符串,如果找不到字符串就记录到错误日志*/
    if (ngx_regex_compile(&rgc) != NGX_OK) {
        ngx_log_error(NGX_LOG_ERR, r->connection->log, 0, "%V", &rgc.err);
        return NGX_HTTP_SSI_ERROR;
    }
    n = (rgc.captures + 1) * 3;
    captures = ngx_palloc(r->pool, n * sizeof(int));
    if (captures == NULL) {
        return NGX_ERROR;
}
/*使用编译好的模式进行匹配,采用与Perl相似的算法,返回匹配串的偏移位置*/
    rc = ngx_regex_exec(rgc.regex, str, captures, n);//
……
#else
    ngx_log_error(NGX_LOG_ALERT, r->connection->log, 0,
                  "the using of the regex \"%V\" in SSI requires PCRE library",
                  pattern);
    return NGX_HTTP_SSI_ERROR;
#endif
}
```

------





## 10.3 日志时间格式

ngx_time_t结构用秒、毫秒和GMT偏移来表示3种不同类型的时间,示例如下:

------

```
typedef struct {
    time_t      sec;
    ngx_uint_t  msec;
    ngx_int_t   gmtoff;
} ngx_time_t;
```

------

ngx_tm_t结构是UNIX平台上的struct tm和Windows上的SYSTEMTIME的别名。在ngx_times.c文件中可以看到定义的格式,可用的字符串表示形式为:

------

```
static u_char            cached_err_log_time[NGX_TIME_SLOTS]
                                    [sizeof("1970/09/28 12:00:00")];
static u_char            cached_http_time[NGX_TIME_SLOTS]
                                    [sizeof("Mon, 28 Sep 1970 06:00:00 GMT")];
static u_char            cached_http_log_time[NGX_TIME_SLOTS]
                                    [sizeof("28/Sep/1970:12:00:00 +0600")];
static u_char            cached_http_log_iso8601[NGX_TIME_SLOTS]
                                    [sizeof("1970-09-28T12:00:00+06:00")];
static u_char            cached_syslog_time[NGX_TIME_SLOTS]
                                    [sizeof("Sep 28 12:00:00")];
```

------

以下为相关函数的功能说明及示例。

·ngx_cached_err_log_time:用于错误日志条目"1970/09/2812:00:00"。

·ngx_cached_http_log_time:用于HTTP访问日志条目"28/Sep/1970:12:00:00+0600"。

·ngx_cached_syslog_time:用于syslog条目"Sep2812:00:00"。

·ngx_cached_http_time:在HTTP标头中使用"Mon,28Sep197006:00:00GMT"。

·ngx_cached_http_log_iso8601:ISO8601标准格式"1970-09-28T12:00:00+06:00"。

ngx_time():以秒为单位返回当前时间值。例如:

------

```
time_t  now = ngx_time();
```

------

ngx_timeofday():以秒为单位返回当前时间值,是访问缓存时间值的首选方法。例如:

------

```
ngx_time_t tp = ngx_timeofday();
```

------

ngx_gettimeofday():显式获取时间,并更新其参数(指向struct timeval的指针)。例如:

------

```
struct timeval  tp;
    ngx_gettimeofday(&tp);
```

------

ngx_time_update()或ngx_time_sigsafe_update():立即更新时间。例如:

------

```
    ngx_time_update();
```

------

ngx_http_time(buf,time):返回适合在HTTP头中使用的字符串表示(如"Mon,28Sep197006:00:00GMT")。例如:

------

```
ngx_table_elt_t     *e;
time_t             expires_time;
ngx_http_time(e->value.data, expires_time);
```

------

ngx_http_cookie_time(buf,time)函数返回字符串,如HTTP cookies("Thu,31-Dec-3723:55:55GMT")。例如:

------

```
u_char           *cookie, *p;
ngx_http_userid_conf_t *conf;
        p = ngx_http_cookie_time(p, ngx_time() + conf->expires);
    }
```

------

ngx_gmtime()、ngx_libc_gmtime():时间表示为UTC格式。例如:

------

```
u_char *
ngx_http_time(u_char *buf, time_t t)
{
    ngx_tm_t  tm;
    ngx_gmtime(t, &tm);
    return ngx_sprintf(buf, "%s, %02d %s %4d %02d:%02d:%02d GMT",
                       week[tm.ngx_tm_wday],
                       tm.ngx_tm_mday,
                       months[tm.ngx_tm_mon - 1],
                       tm.ngx_tm_year,
                       tm.ngx_tm_hour,
                       tm.ngx_tm_min,
                       tm.ngx_tm_sec);
}
```

------

ngx_localtime()、ngx_libc_localtime():相对于当地时区表示的时间。例如:

------

```
ngx_tm_t         tm;
    time_t           sec;
ngx_localtime(sec, &tm);
```

------





## 10.4 数据结构

本节主要介绍Nginx中定义的数据结构,有数组、单向链表、双向链表、红黑树和散列表,同时对每种数据类型将给出简单的代码示例。





### 10.4.1 数组

Nginx数组类型ngx_array_t定义如下:

------

```
typedef struct { 
    void * elts; 
    ngx_uint_t nelts; 
    size_t size; 
    ngx_uint_t nalloc; 
    ngx_pool_t * pool; 
} ngx_array_t;
```

------

其中,elts字段中提供了数组的元素,nelts字段包含元素的数量,size字段包含单个元素的大小,并在初始化数组时设置。使用以下函数将元素添加到数组中:

·ngx_array_push(a):添加一个尾部元素并返回指向它的指针。

·ngx_array_push_n(a,n):添加n个尾部元素并返回指向第一个元素的指针。

·ngx_array_create(p,n,size):新建数组。

·ngx_array_destroy(a):销毁数组。

Nginx中涉及的代码如下:

------

```
static char *
ngx_mail_auth_http_header(ngx_conf_t *cf, ngx_command_t *cmd, void *conf)
{
    ngx_mail_auth_http_conf_t *ahcf = conf;
    ngx_str_t        *value;
    ngx_table_elt_t  *header;
    if (ahcf->headers == NULL) {
        ahcf->headers = ngx_array_create(cf->pool, 1, sizeof(ngx_table_elt_t));
                                                                                      //新建数组
        if (ahcf->headers == NULL) {
            return NGX_CONF_ERROR;
        }
    }
    header = ngx_array_push(ahcf->headers);                        //赋值给数组
    if (header == NULL) {
        return NGX_CONF_ERROR;
    }
    value = cf->args->elts;
    header->key = value[1];
    header->value = value[2];
    return NGX_CONF_OK;
}
```

------





### 10.4.2 单向链表

在Nginx中,单向链表称之为列表,列表是一系列数组。ngx_list_t列表类型定义如下:

------

```
typedef struct {
    ngx_list_part_t  *last;
    ngx_list_part_t   part;
    size_t            size;
    ngx_uint_t        nalloc;
    ngx_pool_t       *pool;
} ngx_list_t;
```

------

实际项目存储在列表部分中,其定义如下:

------

```
typedef struct ngx_list_part_s  ngx_list_part_t;
struct ngx_list_part_s {
    void             *elts;
    ngx_uint_t        nelts;
    ngx_list_part_t  *next;
};
```

------

·ngx_list_init(list、pool、n、size)在使用之前,必须初始化。

·ngx_list_create(pool、n、ize):创建列表。

·ngx_list_push(list):将项添加到列表中。

单向链表使用示例如下:

------

```
static ngx_int_t
ngx_http_ssi_set(ngx_http_request_t *r, ngx_http_ssi_ctx_t *ctx,
    ngx_str_t **params)
{
    ngx_int_t            rc;                   /* 
    ngx_str_t           *name, *value, *vv;      *
    ngx_uint_t           key;                  * 自定义数据类型
    ngx_http_ssi_var_t  *var;                   */
    ngx_http_ssi_ctx_t  *mctx;
    mctx = ngx_http_get_module_ctx(r->main, ngx_http_ssi_filter_module);
                                                                                             /*回调方法*/
    if (mctx->variables == NULL) {
        mctx->variables = ngx_list_create(r->pool, 4,             /*创建列表*/
                                          sizeof(ngx_http_ssi_var_t));
        if (mctx->variables == NULL) {
            return NGX_ERROR;
        }
    }
    name = params[NGX_HTTP_SSI_SET_VAR];
    value = params[NGX_HTTP_SSI_SET_VALUE];
    rc = ngx_http_ssi_evaluate_string(r, ctx, value, 0);
    if (rc != NGX_OK) {
        return rc;
    }
    key = ngx_hash_strlow(name->data, name->data, name->len);
                                                                               /*将字符转成小写并存储*/
    vv = ngx_http_ssi_get_variable(r, name, key);
    if (vv) {
        *vv = *value;
        return NGX_OK;
    }
    var = ngx_list_push(mctx->variables);      /*分配并将新元素添加到内存池的链接
                                                                      列表中*/
    if (var == NULL) {
        return NGX_ERROR;
    }
    var->name = *name;
    var->key = key;
    var->value = *value;
    return NGX_OK;
}
```

------

列表主要用于HTTP输入和输出标头,不支持删除项目。但在需要时,项目可以在内部被标记为缺失,实际上并不会从列表中删除。例如,要将HTTP输出标头(存储为ngx_table_elt_t对象)标记为缺失,将ngx_table_elt_t中的哈希字段设置为0即可。迭代标题时,会显式跳过以这种方式标记的项目。





### 10.4.3 双向链表

ngx_queue_t队列是一个双向链表,每个节点定义如下:

------

```
typedef struct ngx_queue_s  ngx_queue_t;
struct ngx_queue_s {
    ngx_queue_t  *prev;
    ngx_queue_t  *next;
};
```

------

链表头节点未与任何数据链接,使用前必须要用ngx_queue_init(q)调用初始化列表头。队列支持以下操作:

ngx_queue_insert_head(h,x)、ngx_queue_insert_tail(h,x):插入新节点。例如:

------

```
ngx_http_limit_req_ctx_t *ctx;
ngx_http_limit_req_node_t *lr;
ngx_queue_insert_head(&ctx->sh->queue, &lr->queue);
```

------

ngx_queue_remove(x):删除队列节点。例如:

------

```
ngx_http_limit_req_node_t *lr;
ngx_queue_remove(&lr->queue);
```

------

ngx_queue_split(h,q,n):在节点上拆分队列,将队列尾部返回到单独的队列中。例如:

------

```
ngx_queue_t                 *q, *locations, *named, tail;
  ngx_queue_split(locations, q, &tail);
```

------

ngx_queue_add(h,n):将第二个队列添加到第一个队列中。例如:

------

```
ngx_queue_t *locations;
ngx_queue_t                *x, tail;
    ngx_queue_add(locations, &tail);
```

------

ngx_queue_head(h)、ngx_queue_last(h):获取第一个或最后一个队列节点。例如:

------

```
    ngx_queue_t  *middle, *next;
    middle = ngx_queue_head(queue);
    if (middle == ngx_queue_last(queue)) {
        return middle;
    }
```

------

ngx_queue_sentinel(h):获取队列sentinel对象以结束迭代。例如:

------

```
ngx_queue_t       *q, *cache;
ngx_queue_sentinel(cache);
```

------

ngx_queue_data(q、type、link):考虑队列中的队列字段偏移,获取对队列节点数据结构开头的引用。例如:

------

```
q = ngx_queue_last(&ctx->sh->queue);
lr = ngx_queue_data(q, ngx_http_limit_req_node_t, queue);
```

------





### 10.4.4 红黑树

红黑树在数据检索速度上比链表更有效率,在src/core/ngx_rbtree.h头文件中提供了对红黑树的有效实现。具体如下:

------

```
struct ngx_rbtree_node_s {
    ngx_rbtree_key_t       key;                          //key
    ngx_rbtree_node_t     *left;                   //左节点
    ngx_rbtree_node_t     *right;                    //右节点
    ngx_rbtree_node_t     *parent;                    //父节点
    u_char                 color;                     //颜色
    u_char                 data;                           //数据
}; 
```

------

相关函数说明如下:

ngx_rbtree_init(tree,s,i):初始化。示例如下:

------

```
ngx_rbtree_init(tree, s, i):初始化。示例如下:

ngx_rbtree_init(&ctx->sh->rbtree, &ctx->sh->sentinel,
            ngx_http_limit_req_rbtree_insert_value);
```

------

void ngx_rbtree_insert(ngx_rbtree_t*tree,ngx_rbtree_node_t*node):遍历树并插入新值。示例如下:

------

```
ngx_rbtree_insert(&ctx->sh->rbtree, node);
```

------

void ngx_rbtree_delete(ngx_rbtree_t*tree,ngx_rbtree_node_t*node):删除key值。示例如下:

------

```
ngx_rbtree_delete(&ctx->sh->rbtree, node);
```

------

在使用红黑树时,先自定义节点树,初始化红黑树,然后遍历树并插入新值、删除值。完整的示范代码可参考第7章ngx_dynamic_limit_req_module模块中的源代码。





### 10.4.5 散列表

哈希表在Nginx里称为散列表,散列表函数在src/core/ngx_hash.h中声明,支持精确匹配和通配符匹配。例如:

------

```
typedef struct {
    ngx_hash_elt_t  **buckets;
    ngx_uint_t        size;
} ngx_hash_t;
typedef struct {
    void             *value;
    u_short           len;
    u_char            name[1];
} ngx_hash_elt_t;
typedef struct {
    ngx_hash_t        hash;
    void             *value;
} ngx_hash_wildcard_t;
typedef struct {
    ngx_str_t         key;
    ngx_uint_t        key_hash;
    void             *value;
} ngx_hash_key_t;
```

------

有关哈希操作的函数及示例如下。

ngx_hash_find():查找元素。例如:

------

```
ngx_hash_find(&hwc->hash, key, &name[n], len - n);
```

------

ngx_hash_find_wc_head():查询包含通配符前的keyhash表。例如:

------

```
ngx_hash_find_wc_head(hash->wc_head, name, len);
```

------

ngx_hash_find_wc_tail():查询包含通配符末尾的keyhash表。例如:

------

```
ngx_hash_find_wc_head(hash->wc_head, name, len);
```

------

ngx_hash_find_combined():查询多个匹配但只返回第一个匹配的结果。例如:

------

```
ngx_hash_find_combined(&map->hash, key, low, len);
```

------

ngx_hash_init():初始化不包含通配符的hash。例如:

------

```
ngx_hash_init(&hash, headers_names.elts, headers_names.nelts);
```

------

ngx_hash_wildcard_init():初始化包含通配符的hash。例如:

------

```
ngx_hash_wildcard_init(&hash, conf->keys->dns_wc_head.elts,
                                   conf->keys->dns_wc_head.nelts);
```

------

ngx_hash():生成完整哈希。例如:

------

```
ngx_hash(ctx->key, ch);
```

------

ngx_hash_key():创建key。例如:

------

```
    hk->key_hash = ngx_hash_key(key->data, last);
```

------

ngx_hash_key_lc():创建key,并将字符全部转换成小写。例如:

------

```
    hk->key_hash = ngx_hash_key_lc(src[i].key.data, src[i].key.len);
```

------

ngx_hash_strlow():将给定字符串设置为小写,并将其存储在dst中,同时使用该字符串生成散列hash。例如:

------

```
   rlcf->hash = ngx_hash_strlow(value[1].data, value[1].data, value[1].len);
```

------

ngx_hash_keys_array_init():将key存在其中并初始化。例如:

------

```
ngx_hash_keys_array_init(cmcf->variables_keys, NGX_HASH_SMALL);
```

------

ngx_hash_add_key():将key插入哈希数组。例如:

------

```
  rc = ngx_hash_add_key(cmcf->variables_keys, &v->name, v, 0);
```

------





## 10.5 内存管理

Nginx以高性能低消耗著称,所以对内存的管理非常苛刻,为此它封装了多个高效函数来简化内存申请、回收和重用。除了对系统malloc、free函数重新包装之外,Nginx还提供了很多用于高效内存管理的函数。





### 10.5.1 堆

堆(heap)和栈的区别是堆是由使用者管理内存,而栈则是由编译器管理;堆是一种基于二叉树的数据结构,栈则是一种只能在一端进行插入和删除操作的特殊线性表,而不管它们如何实现。在堆中,最高或最低优先级元素始终存储在根目录中。

相关函数和示例如下:

ngx_alloc(size,log):从系统堆分配内存。这是malloc()的包装器,具有日志记录支持的作用。分配错误和调试信息将记录到日志中。例如:

------

```
ngx_buf_t         buf;
ngx_conf_t *cf;
  buf.start = ngx_alloc(NGX_CONF_BUFFER, cf->log);
```

------

ngx_calloc(size,log):从系统堆中分配内存,如ngx_alloc(),但在分配后用0填充内存。例如:

------

```
ngx_cached_open_file_t *file;
 file->event = ngx_calloc(sizeof(ngx_event_t), log);
```

------

ngx_memalign(alignment,size,log):从系统堆中分配对齐的内存。这是提供该功能平台上的posix_memalign()的包装器。否则,其实现将回退到ngx_alloc()。它提供了最大的对齐。例如:

------

```
  ngx_pool_t  *p;
    p = ngx_memalign(NGX_POOL_ALIGNMENT, size, log);
    if (p == NULL) {
        return NULL;
    }
```

------

ngx_free(p):释放分配内存,这是free()的包装器。例如:

------

```
    var = ngx_alloc(sizeof(NGINX_VAR)
                    + cycle->listening.nelts * (NGX_INT32_LEN + 1) + 2,
                    cycle->log);
    if (var == NULL) {
        ngx_free(env);
        return NGX_INVALID_PID;
    }
```

------





### 10.5.2 池

大多数Nginx内存分配都是在池(pool)中完成的。当池被销毁时,Nginx池中分配的内存将自动释放。

Nginx池的类型是ngx_pool_t,相关函数和示例如下:

ngx_create_pool(size,log):创建具有指定块大小的池,返回的池对象也在池中分配。例如:

------

```
ngx_log_t        *log;
ngx_cycle_t      *cycle, init_cycle;
init_cycle.pool = ngx_create_pool(1024, log);
```

------

ngx_destroy_pool(pool):销毁所有池内存,包括池对象本身。例如:

------

```
    ngx_log_t           *log;
    ngx_conf_t           conf;
    ngx_pool_t          *pool;
    pool = ngx_create_pool(NGX_CYCLE_POOL_SIZE, log);
    if (pool == NULL) {
        return NULL;
    }
    if (cycle == NULL) {
        ngx_destroy_pool(pool);
        return NULL;
    }
```

------

下面是关于管理pool相关函数的原型和功能说明:

·ngx_palloc(pool,size):从指定的池中分配对齐的内存。

·ngx_pcalloc(pool,size):从指定的池中分配对齐的内存并用0填充它。

·ngx_pnalloc(pool,size):从指定的池中分配未对齐的内存,主要用于分配字符串。

·ngx_pfree(pool,p):只释放大内存,不会释放其对应的头部结构,遗留的头部结构会用于下一次申请大内存。

链(ngx_chain_t)在Nginx中被主动使用,因此Nginx池实现提供了重用它们的方法。ngx_pool_t的chain字段保留了以前分配的链列表,可以重用。要在池中有效分配链,则可以使用ngx_alloc_chain_link(pool)功能。此函数在池列表中查找自由链,并在池列表为空时分配新的链。要释放链,可以调用ngx_free_chain(pool、cl)函数。

清理处理程序可以在池中注册。清理处理程序是一个带有参数的回调函数,该函数在销毁池时调用。池通常绑定到特定的Nginx对象(如HTTP请求)中,并在对象生命周期结束时被销毁。注册池清理是释放资源、关闭文件描述符。

如要清理注册池,可调用ngx_pool_cleanup_add(pool,size),它返回一个ngx_pool_cleanup_t指针,由调用者填写,使用size参数为清理处理程序分配上下文。示例如下:

------

```
ngx_open_file_cache_t *
ngx_open_file_cache_init(ngx_pool_t *pool, ngx_uint_t max, time_t inactive)
{
    ngx_pool_cleanup_t     *cln;
    ngx_open_file_cache_t  *cache;
    cache = ngx_palloc(pool, sizeof(ngx_open_file_cache_t));
                                                                                      /* 分配内存给池 */
    if (cache == NULL) {
        return NULL;
    }
    ngx_rbtree_init(&cache->rbtree, &cache->sentinel,      /* 初始化红黑树 */
                    ngx_open_file_cache_rbtree_insert_value);
    ngx_queue_init(&cache->expire_queue);                     /* 初始化队列 */
    cache->current = 0;
    cache->max = max;
    cache->inactive = inactive;
    cln = ngx_pool_cleanup_add(pool, 0);                          /*清理注册池 */
    if (cln == NULL) {
        return NULL;
    }
    cln->handler = ngx_open_file_cache_cleanup;
    cln->data = cache;
return cache;
}
```

------





### 10.5.3 共享内存

Nginx使用共享内存(shared memory)在进程之间共享公共数据。ngx_shared_memory_add(cf、name、size、tag)函数将新的共享内存条目ngx_shm_zone_t添加到循环中,这个函数接收name和size区域。每个共享区域必须具有唯一名称。

如果name和tag已存在共享区域条目,则重用现有区域条目;如果有相同name但是具有不同的tag,则该函数失败并显示错误。通常,模块结构的地址被传递为tag,这样可以在一个Nginx模块中按名称重用共享区域。

ngx_shm_zone_t结构的定义如下:

------

```
struct ngx_shm_zone_s {
    void                     *data;            //数据上下文,用于将任意数据传递给init回调
    ngx_shm_t shm;                              //特定于平台的对象类型
    ngx_shm_zone_init_pt      init;      //初始化回调,在共享区域映射到实际内存后调用
    void                     *tag;            //共享区域标记
    void                     *sync;       //同步享区域
    ngx_uint_t                noreuse;      //禁用旧循环重用共享区域的标志
};
typedef struct {
    u_char      *addr;            //映射共享内存地址,最初为NULL
    size_t       size;             //共享内存大小
    ngx_str_t    name;            //共享内存名称
    ngx_log_t   *log;            //共享内存日志
    ngx_uint_t   exists;       //表示共享内存的标志是从主进程继承的(特定于Windows)
} ngx_shm_t;
```

------

ngx_init_cycle()解析配置后,共享区域条目将映射到实际内存中。在POSIX系统中,mmap()用于创建共享匿名映射;在Windows中,使用CreateFileMapping()或者MapView-OfFileEx()创建共享匿名映射。

为了在共享内存中分配池,Nginx提供了slab池ngx_slab_pool_t类型。在每个Nginx共享区域中自动创建用于分配内存的slab池。池位于共享区域的开头,可以通过表达式访问(ngx_slab_pool_t*)shm_zone->shm.addr。相关函数如下:

·ngx_slab_alloc(pool,size):共享区域中分配内存。

·ngx_slab_calloc(pool,size):共享区域中分配内存。

·ngx_slab_free(pool,p):释放共享区域内存。

·ngx_slab_init(pool):初始化共享区域。

·ngx_slab_alloc_locked(pool,size):加锁。

·ngx_slab_calloc_locked(pool,size):加锁。

·ngx_slab_free_locked(pool,p):解锁。

·ngx_slab_alloc_pages(pool,pages):申请内存页。

·ngx_slab_free_pages(pool,page,pages):释放内存页。

·ngx_slab_error(pool,level,text):错误处理。

slab池将所有共享区域划分为页面,每个页面用于分配相同大小的对象,指定的大小必须是2的幂,并且大于8字节,不合格的值将被四舍五入。每个页面的位掩码跟踪正在使用哪些块、哪些块可以自由分配。对于大于半页的大小(通常为2048字节),可一次分配整个页面。

要保护共享内存中的数据不受并发访问影响,使用mutex字段中可用的互斥锁ngx_slab_pool_t来保护。在分配和释放内存时,slab池最常使用互斥锁,它可用于保护共享区域中分配的其他用户数据结构。相关函数如下:

·ngx_shmtx_lock(&shpool->mutex):锁定共享内存。

·ngx_shmtx_create(&shpool->mutex,addr,name):新建共享内存。

·ngx_shmtx_wakeup(&shpool->mutex):唤醒需要特定编译。

·ngx_shmtx_destroy(&shpool->mutex):销毁共享内存。

·ngx_shmtx_trylock(&shpool->mutex):试探锁。

·ngx_shmtx_unlock(&shpool->mutex):解锁互斥锁。

·ngx_shmtx_force_unlock(&shpool->mutex,pid):强制解锁。

相关代码示例可参考第7章中的ngx_dynamic_limit_req_module模块,其代码太长这里不再展示。





## 10.6 日志记录

日志不仅能提供一般的访问记录,还可以帮助用户调试服务,排查问题。Nginx提供了不同粒度的日志记录方案,当遇到Nginx故障时可按需开启粒度记录从而排查问题,对于日志记录,Nginx使用ngx_log_t对象。Nginx记录器支持以下几种类型的输出:

·stderr:记录到标准错误。

·file:记录到文件。

·syslog:记录到syslog。

·memory:记录到内部存储器,以用于开发目的,可以使用调试器访问内存。

Nginx记录器支持以下严重性级别:

·NGX_LOG_EMERG

·NGX_LOG_ALERT

·NGX_LOG_CRIT

·NGX_LOG_ERR

·NGX_LOG_WARN

·NGX_LOG_NOTICE

·NGX_LOG_INFO

·NGX_LOG_DEBUG

对于调试日志记录,Nginx记录器也会检查调试掩码。调试掩码如下:

·NGX_LOG_DEBUG_CORE

·NGX_LOG_DEBUG_ALLOC

·NGX_LOG_DEBUG_MUTEX

·NGX_LOG_DEBUG_EVENT

·NGX_LOG_DEBUG_HTTP

·NGX_LOG_DEBUG_MAIL

·NGX_LOG_DEBUG_STREAM

Nginx提供了以下日志记录宏:

·ngx_log_error(level,log,err,fmt,...):错误记录。

·ngx_log_debug0(level,log,err,fmt)、ngx_log_debug1(level,log,err,fmt,arg1)等调试记录多达8个支持的格式参数。

示例如下:

------

```
ngx_log_debug3(NGX_LOG_DEBUG_HTTP, r->connection->log, 0,
                       "access: %08XD %08XD %08XD",
addr, rule[i].mask, rule[i].addr);
ngx_log_error(NGX_LOG_INFO, r->connection->log, 0,"cache lock timeout");
```

------





## 10.7 结构体

Nginx中定义了很多结构体,囊括了各种需求,如果还不能满足你的需求,开发者还可以自定义结构体,而本节只介绍比较核心的几个结构体,分别是循环体ngx_cycle_t、缓冲体ngx_buf_t、连接体ngx_connection_t及事件体ngx_event_t。





### 10.7.1 ngx_cycle_t循环结构体

循环对象存储特定配置创建的Nginx运行时上下文,它的类型是ngx_cycle_t。当前循环由ngx_cycle全局变量引用,并在nginx worker启动时继承。当每次重新加载Nginx配置时,都会从新的Nginx配置创建一个新的循环,成功创建新循环后,通常会删除旧循环。

循环由ngx_init_cycle()函数创建,该函数将前一个循环作为其参数。该函数定位上一个循环的配置文件,并从前一个循环继承尽可能多的资源。称为“初始循环”的占位符循环创建为Nginx启动,然后由从配置构建的实际循环替换。该周期的成员包括:

------

```
struct ngx_cycle_s {
/* 保存所有模块配置项的结构体指针,它是一个数组,每个数组又是一个指针,这个指针指向另
一个存储指针的数组 */
void ****conf_ctx;
    ngx_pool_t pool;  /* 周期池,为每个新周期创建 */
    ngx_log_tlog;/*循环日志最初从旧循环继承,设置为new_log在读取配置后的指向*/
    ngx_log_t new_log;      //循环日志,由配置创建。它受root-scopeerror_log指令的
                                          影响
    ngx_uint_t log_use_stderr;  /* unsigned  log_use_stderr:1; */
ngx_connection_t        **files;//用于将文件描述符映射到Nginx连接的数组。该映射
                                                      由具有NGX_USE_FD_EVENT标志(当前,它poll
                                                      和devpoll)的事件模块使用
    ngx_connection_t         *free_connections;      //可用连接池
    ngx_uint_t                free_connection_n;      // 可用连接池中连接的数量
    ngx_module_t            **modules;       //当前配置加载的静态和动态类型的模块数组
    ngx_uint_t                modules_n;                  //模块数量
    ngx_uint_t                modules_used;             //1为模块启用
    ngx_queue_t               reusable_connections_queue;
                                                                      //表示可重复使用连接队列
    ngx_array_t               listening;
                                              //通常通过listen调用该ngx_create_listening()函
                                                数的不同模块的指令添加侦听对象
ngx_array_t               paths;
/* 路径数组ngx_path_t。需要操作目录的模块,就会调用ngx_add_path()函数来添加路径
如果缺少,这些目录是在读取配置后由Nginx创建的。此外,还可以为每个路径添加两个处理程
序即路径加载器和路径管理器。
*路径加载器:在启动或重新加载Nginx后,仅在60秒内执行一次。通常,加载程序读取目录并
将数据存储在Nginx共享内存中。从专用的Nginx进程Nginx缓存加载器调用该处理程序。
*路径管理器:定期执行。通常,管理器从目录中删除旧文件并更新Nginx*内存以反映更改。处
理程序从专用的“Nginx缓存管理器”进程调用
*/
  ngx_array_t               config_dump;             //将配置加载到内存
    ngx_list_t                open_files;             //打开文件对象列表
    ngx_list_t                shared_memory;
                                              //共享内存区域列表,每个区域通过调用ngx_shared_
                                                memory_add()函数添加。共享区域映射到所有Nginx进
                                                程中的相同地址范围,并用于共享公共数据
    ngx_uint_t                connection_n;      //worker_connections配置中的指
                                                                        令设置连接数
    ngx_uint_t                files_n;      //将文件描述符映射到Nginx连接的数组中
    ngx_connection_t         *connections;       //连接数组
    ngx_event_t              *read_events;      //读事件
    ngx_event_t              *write_events;      //写事件
    ngx_cycle_t              *old_cycle;
ngx_str_t                 conf_file;       //配置文件相对安装目录的路径,即相对路径
    ngx_str_t                 conf_param;            //处理配置文件时携带的参数
    ngx_str_t                 conf_prefix;            //配置文件所在路径
    ngx_str_t                 prefix;                   //安装目录路径
    ngx_str_t                 lock_file;            //进程间同步文件锁
    ngx_str_t                 hostname;            //主机名
};
```

------





### 10.7.2 ngx_buf_t缓冲区结构体

对于输入和输出操作,Nginx提供了缓冲区类型ngx_buf_t,用于保存要写入的目标或从源读取的数据。缓冲区可以引用内存或文件中的数据,缓冲区的内存是单独分配的,与缓冲区结构ngx_buf_t无关。

ngx_buf_t结构的定义如下:

------

```
struct ngx_buf_s {
    u_char          pos;/* 内存缓冲区的边界,通常的子范围为start..end
    u_char          *last; */
    off_t            file_pos;/*文件缓冲区的边界,表示为从文件开头的偏移量
    off_t            file_last; */
    u_char          start;       /*为缓冲区分配的内存块的边界
    u_char          *end;       */
    ngx_buf_tag_ttag;            //用于区分缓冲区的唯一值,由不同的Nginx模块创建,通
                                                常用于缓冲区重用
    ngx_file_t      *file;        //文件对象
    ngx_buf_t       *shadow;      //引用与当前缓冲区相关的另一个(“阴影”)缓冲区,通常
                                                是缓冲区使用阴影中的数据。当消耗缓冲区时,通常还将阴
                                                影缓冲区标记为已消耗
    unsigned         temporary:1;        //表示缓冲区引用可写内存的标志
    unsigned         memory:1;             //表示缓冲区引用只读存储器的标志
    unsigned         mmap:1;      //标志位为1时,表示这段内存是mmap系统调用映射过来
                                                的,不可以被修改
    unsigned         recycled:1;             //标志门,为1时表示可回收
    unsigned         in_file:1;             //表示缓冲区引用文件中数据的标志
    unsigned         flush:1;             //指示缓冲区之前的所有数据都需要刷新的标志
    unsigned         sync:1;       //表示缓冲区不携带数据或特殊信号的标志,如flush或
                                                last_buf。默认情况下,Nginx认为这样的缓冲区是一个
                                                错误条件,但是这个标志告诉Nginx跳过错误检查
    unsigned         last_buf:1;             //缓冲区最后一个标志
    unsigned         last_in_chain:1;      //缓冲区没有更多数据
    unsigned         last_shadow:1;      //缓冲区是最后一个引用特定影子缓冲区
    unsigned         temp_file:1;       //表示缓冲区位于临时文件中的标志
    /* STUB */ int   num;
};
```

------

缓冲区将输入和输出连接在一起。链是ngx_chain_t类型的链序列,定义如下:

------

```
typedef struct ngx_chain_s  ngx_chain_t;
struct ngx_chain_s {
    ngx_buf_t    *buf;
    ngx_chain_t  *next;
};
```

------





### 10.7.3 ngx_connection_t连接结构体

作为一个Web服务,连接通常是被动的,连接是由客户端发起,服务端接收。连接类型ngx_connection_t是套接字描述符的包装器。它的定义如下:

------

```
struct ngx_connection_s {
/*任意连接上下文。通常,它是指向在连接之上构建的更高级别对象的指针,例如,HTTP请求或
Stream会话*/
    void               *data;
    ngx_event_t        *read;                   //读取连接事件
    ngx_event_t        *write;                   //写入连接事件
    ngx_socket_t        fd;                         //套接字描述符
    ngx_recv_pt         recv;       /* 
    ngx_send_pt         send;       *连接I/O操作
    ngx_recv_chain_pt   recv_chain;  *
    ngx_send_chain_pt   send_chain;  */
    ngx_listening_t    *listening;                   //连接对应的监听对象
    off_t               sent;                               //连接已发送出去的字节数
    ngx_log_t          *log;                               //连接日志
    ngx_pool_t         *pool;                         //连接池
    int                 type;
    struct sockaddr    sockaddr;    /*
    socklen_t           socklen;     *二进制和文本形式的远程套接字地址
    ngx_str_t           addr_text;    */
    ngx_str_t           proxy_protocol_addr;       //PROXY协议客户端地址
    in_port_t           proxy_protocol_port;       //PROXY协议客户端端口
#if (NGX_SSL)
    ngx_ssl_connection_t  *ssl;                    //连接的SSL上下文
#endif
    struct sockaddr    local_sockaddr;/*二进制形式的本地套接字地址。最初这些字段
为空,使用ngx_connection_local_sockaddr()函数来获取本地套接字地址 */
    socklen_t           local_socklen;
    ngx_buf_t       *buffer;                  //用于接收、缓存客户端发来的字符流,它的大小
                                                            由client_header_buffer_size决定
    ngx_queue_t         queue;      //将当前连接添加到双向链表中,表示可以重用的连接
    ngx_atomic_uint_t   number;             //连接使用次数,当主动或者被动连接时,number
                                                            会加1
    ngx_uint_t          requests;       //处理的请求次数
    unsigned            buffered:8;       //缓存中的业务类型,表示8个不同的业务
    unsigned            log_error:3;      //记录错误日志的级别
    unsigned            timedout:1;       //标志位为1时,则表示连接已超时
    unsigned            error:1;             //标志位为1时,则表示连接中出现错误
    unsigned            destroyed:1;       //标志位为1时,则表示连接已销毁
    unsigned            idle:1;             //标志位为1时,则表示连接空闲
    unsigned            reusable:1;      //表示连接处于使其有资格重用的状态标志
    unsigned            close:1;             //表示正在重用连接并需要关闭的标志
    unsigned            shared:1;/
    unsigned            sendfile:1;      //标志位为1时,则表示正在将文件发送到连接的
                                                            另一端
    unsigned            sndlowat:1;/标志位为1时,只有在连接套接字缓冲区满足最低设
置的阀值时,事件模块才会分发事件
    unsigned            tcp_nodelay:2;   /* ngx_connection_tcp_nodelay_e */
    unsigned            tcp_nopush:2;    /* ngx_connection_tcp_nopush_e */
    unsigned            need_last_buf:1;
#if (NGX_HAVE_AIO_SENDFILE)
    unsigned            busy_count:2;
#endif
#if (NGX_THREADS)
    ngx_thread_task_t  *sendfile_task;
#endif
};
```

------

Nginx连接可以透明地封装SSL层。在这种情况下,连接的ssl字段包含指向ngx_ssl_connection_t结构的指针,保留连接的所有SSL相关数据,包括SSL_CTX和SSL。recv、send、recv_chain和send_chain处理程序也设置为启用SSL的函数。

Nginx配置中的worker_connections指令限制了每个nginx worker的连接数。当worker启动并存储在循环对象的连接字段中时,所有连接结构都是预先创建的。

由于每个worker的连接数量有限,Nginx提供了一种获取当前正在使用的连接的方法。要启用或禁用连接的重用,需要调用ngx_reusable_connection(c,reusable)函数。调用ngx_reusable_connection(c,1)函数在连接结构中设置重用标志,并将连接插入循环的reusable_connections_queue中。

每当ngx_get_connection()函数发现循环的free_connections列表中没有可用的连接时,会调用ngx_drain_connections()来释放特定数量的可重用连接。对于每个这样的连接,设置关闭标志并调用其读取处理程序,该处理程序应该通过调用ngx_close_connection(c)函数释放连接并使其可用于重用。

要在可以重用连接时退出状态,需要调用ngx_reusable_connection(c,0)函数。HTTP客户端连接是Nginx中可重用连接的一个示例,它们被标记为可重用,直到从客户端收到第一个请求字节为止。





### 10.7.4 ngx_event_t结构体

Nginx中的事件对象ngx_event_t提供了一种通知特定事件发生的机制,实现机制有kqueue、epoll及aio。ngx_event_t中的字段包括以下内容:

------

```
struct ngx_event_s {
    void            *data;                   //事件处理程序中使用的任意事件上下文,指向与
                                                            事件相关的连接指针
    unsigned         write:1;                  //表示写事件的标志
    unsigned         accept:1;
    unsigned         instance:1;
    unsigned         active:1;
    unsigned         disabled:1;
    unsigned         ready:1;                  //表示事件已收到I/O通知的标志
    unsigned         oneshot:1;
    unsigned         complete:1;
    unsigned         eof:1;                  //表示在读取数据时发生EOF的标志
    unsigned         error:1;                  //表示在读取或写入期间发生错误的标志
    unsigned         timedout:1;            //表示事件计时器已过期的标志
    unsigned         timer_set:1;            //表示事件计时器已设置且尚未到期的标志
    unsigned         delayed:1;            //表示由于速率限制而导致I/O延迟的标志
    unsigned         deferred_accept:1;
    unsigned         pending_eof:1;      //指示套接字上EOF未决的标志,即使在它之前可
                                                            能有一些数据可用。该标志通过EPOLLRDHUPepoll
                                                            事件或EV_EOF kqueue标志传递
    unsigned         posted:1;            //表示事件已发布到队列的标志
unsigned         closed:1;
unsigned         channel:1;
    unsigned         resolver:1;
    unsigned         cancelable:1;      //计时器事件标志,指示在关闭worker时应忽略
                                                           该事件。优雅的worker关闭被延迟,直到没有
                                                            安排不可取消的计时器事件为止
#if (NGX_HAVE_KQUEUE)
    unsigned         kq_vnode:1;
    int              kq_errno;
#endif
#if (NGX_HAVE_KQUEUE) || (NGX_HAVE_IOCP)
    int              available;
#else
    unsigned         available:1;
#endif
    ngx_event_handler_pt  handler;      //事件发生时要调用的回调函数
#if (NGX_HAVE_IOCP)
    ngx_event_ovlp_t ovlp;
#endif
    ngx_uint_t       index;
    ngx_log_t       *log;
    ngx_rbtree_node_t   timer;
    ngx_queue_t      queue;                  //用于将事件发布到队列的队列节点

#if 0
    /* 线程支持t */
    void            *thr_ctx;
#if (NGX_EVENT_T_PADDING)
    /*事件不应跨越SMP中的缓存行*/
    uint32_t         padding[NGX_EVENT_T_PADDING];
#endif
#endif
};
```

------





## 10.8 事件

Nginx是一个事件驱动的Web服务器,本节将全面介绍Nginx的事件驱动机制是如何工作的,涉及I/O事件、计时器事件、事件循环等知识点。事件处理框架负责收集、管理和分发事件。如果说Linux一切皆为文件,那么Nginx是一切皆为事件。





### 10.8.1 I/O事件

通过调用ngx_get_connection()函数获得的每个连接都有两个附加事件,即读事件(c->read)和c写事件(c->write),用于接收套接字已准备好读取或写入的通知。所有此类事件都在Edge-Triggered模式下运行,意味着它们仅在套接字状态发生变化时触发通知。

例如,对套接字进行部分读取不会使Nginx传递重复的读取通知,直到更多数据到达套接字为止。即使底层I/O通知机制基本上是Level-Triggered(轮询、选择等),Nginx也会将通知转换为Edge-Triggered。要使Nginx事件通知在不同平台上的所有通知系统中保持一致,则必须在处理I/O套接字通知或调用该套接字上的任何I/O函数后调用下列函数:

·ngx_handle_read_event(rev,flags):读取事件。

·ngx_handle_write_event(wev,lowat):写入事件。

通常,在每个读或写事件处理程序结束时将调用一次函数。





### 10.8.2 定时器事件

可以将事件设置为在超时到期时发送通知。事件使用的计时器以毫秒计数。因为过去某些未指定的点被截断为ngx_msec_t类型,它的当前值可以从ngx_current_msec变量中获得。相关函数如下:

·ngx_add_timer(ev,timer):设置事件的超时。

·ngx_del_timer(ev):删除之前设置的超时事件。

ngx_event_timer_rbtree红黑树存储当前设置的所有超时事件,树中的key是ngx_msec_t类型,是事件发生的时间。树结构支持快速插入和删除操作,以及访问最近的超时操作,Nginx使用树结构来查找等待I/O事件和超时事件到期的时间。





### 10.8.3 发布事件

可以发布一个事件,已发布的事件保存在发布队列中。这意味着稍后将在当前事件循环迭代中的某个时刻调用其处理程序。发布事件是简化代码和转义堆栈溢出的好习惯。相关函数如下:

·ngx_post_event(ev,q):将事件ev发布到后队列q。

·ngx_delete_posted_event(ev):从当前发布的队列中删除事件ev。

·ngx_event_process_posted(ngx_cycle_t*cycle,ngx_queue_t*posted):处理事件队列。它调用事件处理程序直到队列不为空为止。

示例如下:

------

```
static ngx_int_t
ngx_http_v2_process_request_body(ngx_http_request_t *r, u_char *pos,
    size_t size, ngx_uint_t last)
{
    ngx_buf_t                 *buf;
    ngx_int_t                  rc;
    ngx_connection_t          *fc;
    ngx_http_request_body_t   *rb;
    ngx_http_core_loc_conf_t  *clcf;
    fc = r->connection;
    rb = r->request_body;
    buf = rb->buf;
    if (size) {
        if (buf->sync) {
            buf->pos = buf->start = pos;
            buf->last = buf->end = pos + size;
        } else {
            if (size > (size_t) (buf->end - buf->last)) {
                ngx_log_error(NGX_LOG_INFO, fc->log, 0,
                                "client intended to send body data "
                                "larger than declared");
                return NGX_HTTP_BAD_REQUEST;
            }
            buf->last = ngx_cpymem(buf->last, pos, size);
        }
    }
    if (last) {
        rb->rest = 0;
        if (fc->read->timer_set) {
            ngx_del_timer(fc->read);                                     //删除定时器事件
        }
        if (r->request_body_no_buffering) {
            ngx_post_event(fc->read, &ngx_posted_events);      //处理事件队列
            return NGX_OK;
        }
        rc = ngx_http_v2_filter_request_body(r);             //过滤请求正文
        if (rc != NGX_OK) {
            return rc;
        }
        if (buf->sync) {
            /*防止在上游模块中重用此缓冲区*/
            rb->buf = NULL;
        }
        if (r->headers_in.chunked) {
            r->headers_in.content_length_n = rb->received;
        }
        r->read_event_handler = ngx_http_block_reading;
        rb->post_handler(r);
        return NGX_OK;
    }
    if (size == 0) {
        return NGX_OK;
    }
    clcf = ngx_http_get_module_loc_conf(r, ngx_http_core_module);
    ngx_add_timer(fc->read, clcf->client_body_timeout);//添加定时器事件
    if (r->request_body_no_buffering) {
        ngx_post_event(fc->read, &ngx_posted_events);      //提交队列
        return NGX_OK;
    }
    if (buf->sync) {
        return ngx_http_v2_filter_request_body(r);
    }
    return NGX_OK;
}
```

------





### 10.8.4 事件循环

Nginx主进程大部分时间都在sigsuspend()调用中等待信号到达。除了Nginx主进程之外,所有Nginx进程都将执行I/O操作,因此具有事件循环功能。Nginx事件循环在ngx_process_events_and_timers()函数中实现,该函数被重复调用,直到进程退出。事件循环包含以下阶段:

·通过调用ngx_process_events_and_timers()函数找到最接近失效的超时ngx_event_find_timer()函数。此函数可查找计时器树中最左侧的节点,并返回节点到期之前的毫秒数。

·通过调用特定于事件通知机制的处理程序来处理I/O事件,该处理程序由Nginx配置选择。此处理程序等待至少一个I/O事件发生,但仅在下一个超时到期之前。在发生读或写事件时,将ready设置为标志并调用事件的处理程序。对于Linux,通常使用ngx_epoll_process_events()处理程序,它调用epoll_wait()函数等待I/O事件。

·调用过期计时器ngx_event_expire_timers()处理过期事件。计时器树从最左边的元素向右迭代,直接找到已经超时的事件,然后执行超时事件的函数。

·调用处理发布的事件ngx_event_process_posted()函数,重复从发布的事件队列中删除第一个元素并调用元素的处理程序,直到队列为空。

所有Nginx进程也处理信号,信号处理程序仅设置在ngx_process_events_and_timers()函数调用后检查的全局变量中。





## 10.9 进程

本节将介绍Nginx进程是如何工作的。Nginx中有5种类型的进程(1.11.3版本)。进程的类型保存在ngx_process全局变量中,并且是以下几种情况之一。

·NGX_PROCESS_MASTER:读取Nginx配置的主进程创建循环,并启动和控制子进程。它不执行任何I/O,仅响应信号。它的循环函数是ngx_master_process_cycle()。

·NGX_PROCESS_WORKER:处理客户端连接的工作进程,由主进程启动,并响应其信号和通道命令。它的循环函数是ngx_worker_process_cycle(),可以有多个工作进程,由worker_processes指令配置。

·NGX_PROCESS_SINGLE:单个进程,仅在master_process off模式下存在,并且是在该模式下运行的唯一进程。它创建周期(就像主进程一样)并处理客户端连接(就像工作进程一样),它的循环函数是ngx_single_process_cycle()。

·NGX_PROCESS_SIGNALLER:处理信号的进程,由主进程启动,并响应其信号。它的循环函数是ngx_master_process_cycle()。

·NGX_PROCESS_HELPER:辅助进程。目前有两种类型:缓存管理器和缓存加载器,两者的循环函数是ngx_cache_manager_process_cycle()。

Nginx进程处理以下信号:

·NGX_SHUTDOWN_SIGNAL(大多数系统上的SIGQUIT):正常关闭。收到此信号后,主进程向所有子进程发送关闭信号。当没有剩余子进程时,主服务器会销毁循环池并退出。当工作进程收到此信号时,它会关闭所有侦听套接字并等待,直到没有安排不可取消的事件,然后销毁循环池并退出。当缓存管理器或缓存加载器进程收到此信号时,它会立即退出。当进程收到此信号时,ngx_quit变量设置为1,并在处理后立即重置。当工作进程处于关闭状态时,ngx_exiting变量设置为1。

·NGX_TERMINATE_SIGNAL(大多数系统上的SIGTERM):终止。在接收到该信号时,主进程向所有子进程发送终止信号。如果子进程在1秒内没有退出,则主进程发送SIGKILL信号将其终止。当没有剩余子进程时,主进程会销毁循环池并退出。当工作进程、缓存管理器进程或缓存加载器进程收到此信号时,会销毁循环池并退出。收到此信号时,变量ngx_terminate设置为1。

·NGX_NOACCEPT_SIGNAL(大多数系统上的SIGWINCH):关闭所有工作进程和帮助程序进程。当收到此信号后,主进程将关闭其子进程。如果之前启动的新Nginx二进制文件已退出,则再次启动旧master的子进程。工作进程收到此信号后,将在debug_points指令设置的调试模式下关闭。

·NGX_RECONFIGURE_SIGNAL(大多数系统上的SIGHUP):重新配置。当收到此信号后,主进程会重新读取配置并基于它创建新的循环。如果成功创建新循环,则删除旧循环并启动新的子进程。同时,旧子进程接收NGX_SHUTDOWN_SIGNAL信号。在单进程模式下,Nginx会创建一个新的循环,但保留旧循环,直到不再有与之关联的活动连接的客户端。worker和helper进程忽略了这个信号。

·NGX_REOPEN_SIGNAL(大多数系统上的SIGUSR1):重新打开文件。主进程将此信号发送给worker,worker重新打开与周期相关的所有open_files。

·NGX_CHANGEBIN_SIGNAL(大多数系统上的SIGUSR2):更改Nginx二进制文件。主进程启动一个新的Nginx二进制文件并传入所有侦听套接字的列表。在Nginx环境变量中传递的文本格式列表由用分号分隔的描述符号组成。新的Nginx二进制文件读取Nginx变量并将套接字添加到其init周期中,其他进程忽略此信号。这在平滑升级时很方便。

虽然所有Nginx工作进程都能够接收并正确处理POSIX信号,但主进程不使用标准的kill()系统调用向工作者和帮助者传递信号。相反,Nginx使用进程间套接字允许在所有Nginx进程之间发送消息。但目前,消息仅从主节点发送给其子节点。





## 10.10 线程

目前为止Nginx模块几乎没有使用线程接口,虽然线程相对于进程要快很多,但也带来了一些问题,在编写含有线程实现的程序中,锁是不可避免的,如读写锁、死锁、表级锁等,给模块增加了复杂性,这也是很少有模块使用线程的原因。线程的相关函数如下以下:

ngx_int_t ngx_thread_mutex_create()等同:

·pthread_mutexattr_init() 初始化一个互斥属性对象ATTR与所有实现中定义的属性的缺省值

·pthread_mutexattr_settype() 设置互斥锁类型的属性

·pthread_mutex_init() 互斥锁的初始化

·pthread_mutexattr_destroy() 销毁一个互斥属性对象;实际上,对象变得未初始化

ngx_int_t ngx_thread_mutex_destroy()函数:等同pthread_mutex_destroy()函数互斥锁销毁。

ngx_int_t ngx_thread_mutex_lock()函数:等同pthread_mutex_lock()函数锁定互斥锁,如果尝试锁定已经被上锁的互斥锁则阻塞至可用为止。

ngx_int_t ngx_thread_mutex_unlock()函数:等同pthread_mutex_unlock()函数释放互斥锁。

ngx_int_t ngx_thread_cond_create()函数:等同pthread_cond_init()函数初始化条件变量。

ngx_int_t ngx_thread_cond_destroy()函数:等同pthread_cond_destroy()函数销毁条件变量。

ngx_int_t ngx_thread_cond_signal()函数:等同pthread_cond_signal()函数发送信号给另外一个正在处于阻塞等待状态的线程,使其脱离阻塞状态,继续执行。如果没有线程处在阻塞等待状态,pthread_cond_signal也会成功返回。

ngx_int_t ngx_thread_cond_wait()函数等同:pthread_cond_wait()函数等待条件变量。

Nginx不是为每个任务创建新线程,而是实现thread_pool策略,可以为不同目的配置多个线程池(例如,在不同的磁盘集上执行I/O)。每个线程池都是在启动时创建的,包含处理任务队列的有限数量的线程。任务完成后,将调用预定义的完成处理程序。

src/core/ngx_thread_pool.h头文件包含的相关定义如下:

------

```
struct ngx_thread_task_s {
    ngx_thread_task_t   *next;
    ngx_uint_t           id;
    void                *ctx;
    void               (*handler)(void *data, ngx_log_t *log);
    ngx_event_t          event;
};
typedef struct ngx_thread_pool_s  ngx_thread_pool_t;
ngx_thread_pool_t *ngx_thread_pool_add(ngx_conf_t *cf, ngx_str_t *name);
ngx_thread_pool_t *ngx_thread_pool_get(ngx_cycle_t *cycle, ngx_str_t *name);
ngx_thread_task_t *ngx_thread_task_alloc(ngx_pool_t *pool, size_t size);
ngx_int_t ngx_thread_task_post(ngx_thread_pool_t *tp, ngx_thread_task_t *task);
```

------

其中:

·ngx_thread_pool_add():获取对线程池的引用,该线程创建给定名称的新线程池。

·ngx_thread_pool_get():返回对具有该名称池的引用,如果它已经存在。

·ngx_thread_task_alloc():线程池申请内存。

·ngx_thread_task_post():将任务添加到指定线程池tp的队列中。





## 10.11 模块

本节主要介绍模块在编写时config文件的具体配置,以及开发模块的相关函数。了解其使用是模块开发时不可或缺的知识。





### 10.11.1 添加模块

每个独立的Nginx模块都驻留在一个单独的目录中,该目录至少包含两个文件:config和包含模块源代码的文件。配置文件包含Nginx集成模块所需的所有信息,例如:

------

```
ngx_module_type=CORE
ngx_module_name=ngx_test_module
ngx_module_srcs="$ngx_addon_dir/ngx_test_module.c"
. auto/module
ngx_addon_name=$ngx_module_name
```

------

配置文件是POSIX shell脚本,可以设置和访问以下变量:

·ngx_module_type:要构建的模块类型,可能的值是CORE、HTTP、HTTP_FILTER、HTTP_INIT_FILTER、HTTP_AUX_FILTER、MAIL、STREAM或MISC。

·ngx_module_name:模块名称。要从一组源文件构建多个模块,指定以空格分隔的名称列表。第一个名称表示动态模块的输出二进制文件的名称,列表中的名称必须与源代码中使用的名称匹配。

·ngx_addon_name:从配置脚本在控制台的输出中显示模块的名称。

·ngx_module_srcs:用于编译模块以空格分隔的源文件列表,$ngx_addon_dir变量可用于表示模块目录的路径。

·ngx_module_incs:包括构建模块所需的路径。

·ngx_module_deps:以空格分隔的模块依赖项列表,通常是头文件列表。

·ngx_module_libs:以空格分隔的库列表与模块链接。

·ngx_module_link:由构建系统DYNAMIC动态模块或ADDON静态模块设置的变量,用于根据链接类型确定要执行的不同操作。

·ngx_module_order:模块的加截顺序,对于HTTP_FILTER和HTTP_AUX_FILTER模块类型有用,此选项的格式是以空格分隔的模块列表。当前模块名称后面的列表中的所有模块都会在全局模块列表中结束,后者会设置模块初始化的顺序。对于过滤器模块,后面初始化的先执行。





### 10.11.2 核心模块

模块是Nginx的构建基础,其大部分功能都是作为模块实现的。模块源文件必须包含ngx_module_t类型的全局变量,其定义如下:

------

```
struct ngx_module_s {
  …
    void                 *ctx;
    ngx_command_t        *commands;
    ngx_uint_t            type;
    ngx_int_t           (*init_master)(ngx_log_t *log);
    ngx_int_t           (*init_module)(ngx_cycle_t *cycle);
    ngx_int_t           (*init_process)(ngx_cycle_t *cycle);
    ngx_int_t           (*init_thread)(ngx_cycle_t *cycle);
    void                (*exit_thread)(ngx_cycle_t *cycle);
    void                (*exit_process)(ngx_cycle_t *cycle);
    void                (*exit_master)(ngx_cycle_t *cycle);
……
};
```

------

省略的私有部分包括模块版本和签名,并使用预定义的宏NGX_MODULE_V1填充。每个模块将其私有数据保存在ctx字段中,识别在命令数组中指定的配置指令,并且可以在Nginx生命周期的某些阶段调用。模块生命周期包含以下事件:

·配置指令处理程序在主进程的上下文中出现在配置文件中时被调用;

·成功解析配置后,将init_module在主进程的上下文中调用handler。init_module每次加载配置时,都会在主进程中调用该处理程序。

·主进程创建一个或多个工作进程,并由init_process在每个进程中调用处理程序。

·当工作进程从主服务器接收到shutdown或terminate命令时,会调用该exit_process处理程序。

·主进程exit_master在退出之前调用处理程序。

由于线程仅在Nginx中用作具有自己API的补充I/O工具,因此当前不会调用init_thread和exit_thread处理程序,init_master结构不需要实现回调函数,因为是不必要的开销。

ngx_module_t类型中的type字段准确定义了ctx字段中存储的内容。其值为以下几种类型之一:

·NGX_CORE_MODULE

·NGX_EVENT_MODULE

·NGX_HTTP_MODULE

·NGX_MAIL_MODULE

·NGX_STREAM_MODULE

其中,NGX_CORE_MODULE是最基本的类型,因此也是最通用和最低级别的模块类型。其他模块类型在其基础上实现,并提供了一种更方便的方式来处理相应的域,如处理事件或HTTP请求。

核心模块集包括ngx_core_module、ngx_errlog_module、ngx_regex_module、ngx_thread_pool_module和ngx_openssl_module模块。HTTP模块、流模块、邮件模块和事件模块也是核心模块。核心模块的上下文定义为:

------

```
typedef struct {
    ngx_str_t             name;
    void               *(*create_conf)(ngx_cycle_t *cycle);
    char               *(*init_conf)(ngx_cycle_t *cycle, void *conf);
} ngx_core_module_t;
```

------

其中,name是模块名称字符串,create_conf和init_conf是指向分别创建和初始化模块配置的函数指针。对于核心模块,Nginx在解析新配置之前调用create_conf,在成功解析所有配置之后调用init_conf。典型的create_conf函数为配置分配内存并设置默认值。

例如,一个名为ngx_test_module的简单模块如下:

------

```
#include <ngx_config.h>
#include <ngx_core.h>
/* 定义模块数据结构*/
typedef struct {
    ngx_flag_t  enable;
} ngx_test_conf_t;
/* 声明函数原型*/
static void *ngx_test_create_conf(ngx_cycle_t *cycle);
static char *ngx_test_init_conf(ngx_cycle_t *cycle, void *conf);
static char *ngx_test_enable(ngx_conf_t *cf, void *post, void *data);
static ngx_conf_post_t  ngx_test_enable_post = { ngx_test_enable };
/* 模块指令*/
static ngx_command_t  ngx_test_commands[] = {
{ ngx_string("test_enabled"),
      NGX_MAIN_CONF|NGX_DIRECT_CONF|NGX_CONF_FLAG,
      ngx_conf_set_flag_slot,
      0,
offsetof(ngx_test_conf_t, enable),
&ngx_test_enable_post },
      ngx_null_command
};
/* 定义模块上下文*/
static ngx_core_module_t  ngx_test_module_ctx = {
    ngx_string("test"),
    ngx_test_create_conf,
    ngx_test_init_conf
};
ngx_module_t  ngx_test_module = {
    NGX_MODULE_V1,
&ngx_test_module_ctx,           /* 模块上下文 */
    ngx_test_commands,           /* 模块目录 */
    NGX_CORE_MODULE,             /* 模块类型 */
NULL,                              /* master进程初始化时调用回调函数,此处为空*/
NULL,                              /* master进程解析配置以后初始化模块时调用一次*/
NULL,                              /* worker进程初始化时调用一次*/
NULL,                    /*为多线程时,线程初始化时调用。UNIX/Linux环境下未使用多线程*/
NULL,                               /*多线程退出时调用*/
NULL,                               /* worker进程退出时调用一次*/
NULL,                               /* master进程退出时调用一次*/
    NGX_MODULE_V1_PADDING
};
/* 是给“test_enabled”指令分配内存的函数,用它来分配内存以存放test_enabled的参数*/
static void *
ngx_test_create_conf(ngx_cycle_t *cycle)
{
    ngx_test_conf_t  *fcf;
    fcf = ngx_pcalloc(cycle->pool, sizeof(ngx_test_conf_t));
    if (fcf == NULL) {
        return NULL;
    }
    fcf->enable = NGX_CONF_UNSET;
    return fcf;
}
/* 调用模块*/
static char *
ngx_test_init_conf(ngx_cycle_t *cycle, void *conf)
{
    ngx_test_conf_t *fcf = conf;
    ngx_conf_init_value(fcf->enable, 0);
    return NGX_CONF_OK;
}
/* 回调函数,启用模块*/
static char *
ngx_test_enable(ngx_conf_t *cf, void *post, void *data)
{
    ngx_flag_t  *fp = data;
    if (*fp == 0) {
        return NGX_CONF_OK;
    }
    ngx_log_error(NGX_LOG_NOTICE, cf->log, 0, "test Module is enabled");
    return NGX_CONF_OK;
}
```

------





### 10.11.3 配置指令

ngx_command_t类型定义单个配置指令。每个支持配置的模块都提供了一系列此类结构,用于描述如何处理参数及要调用的处理程序如下:

------

```
typedef struct ngx_command_s  ngx_command_t;
struct ngx_command_s {
    ngx_str_t             name;
    ngx_uint_t            type;
    char               *(*set)(ngx_conf_t *cf, ngx_command_t *cmd, void *conf);
    ngx_uint_t            conf;
    ngx_uint_t            offset;
    void                 *post;
};
```

------

使用特殊值ngx_null_command终止数组,name是配置文件中出现的指令名称,如worker_processes或listen。type是标志的位字段,用于指定指令所采用的参数数量、类型以及它出现的上下文。标志是:

·NGX_CONF_NOARGS:指令不带参数。

·NGX_CONF_1MORE:指令采用一个或多个参数。

·NGX_CONF_2MORE:指令需要两个或多个参数。

·NGX_CONF_TAKE1..NGX_CONF_TAKE7:指令完全采用指定数量的参数。

·NGX_CONF_TAKE12、NGX_CONF_TAKE13、NGX_CONF_TAKE23、NGX_CONF_TAKE123、NGX_CONF_TAKE1234:指令可以采取不同数量的参数。该选项仅限于给定的数字。例如,NGX_CONF_TAKE12意味着它需要一个或两个参数。

指令类型的标志是:

·NGX_CONF_BLOCK:指令是一个块,也就是说,它可以在其开始和结束括号内包含其他指令,甚至可以实现自己的解析器来处理内部的内容。

·NGX_CONF_FLAG:指令采用布尔值,可以打开或关闭。

指令的上下文定义了指令在配置中的显示位置,具体如下:

·NGX_MAIN_CONF:在顶级上下文中,http块的上一级。

·NGX_HTTP_MAIN_CONF:在http块中。

·NGX_HTTP_SRV_CONF:在http块内的server块中。

·NGX_HTTP_LOC_CONF:在http块内的location块中。

·NGX_HTTP_UPS_CONF:在http块内的upstream块中。

·NGX_HTTP_SIF_CONF:在http块中的server块内的if块中。

·NGX_HTTP_LIF_CONF:在http块中的location块内的if块中。

·NGX_HTTP_LMT_CONF:在http块内的limit_except块中。

·NGX_STREAM_MAIN_CONF:在stream块中。

·NGX_STREAM_SRV_CONF:在stream块中的location块中。

·NGX_STREAM_UPS_CONF:在stream块内的upstream块中。

·NGX_MAIL_MAIN_CONF:在mail块中。

·NGX_MAIL_SRV_CONF:在mail块中的server块中。

·NGX_EVENT_CONF:在event块中。

·NGX_DIRECT_CONF:不创建上下文层次结构且仅具有一个全局配置的模块使用。此配置作为conf参数传递给处理程序。

配置解析器使用这些标志在错误指令的情况下抛出错误并调用提供有正确配置指针的指令处理程序,以便不同位置的相同指令可以将它们的值存储在不同的位置。set字段定义处理指令并将解析的值存储到相应配置的处理程序中。有许多功能可以执行常见的转换,具体如下:

·ngx_conf_set_flag_slot:将文字字符串打开或关闭,分别转换为值为1或0的ngx_flag_t值。

·ngx_conf_set_str_slot:将字符串存储为ngx_str_t类型的值。

·ngx_conf_set_str_array_slot:将值附加到字符串ngx_str_t的数组ngx_array_t中。如果数组尚不存在,则创建该数组。

·ngx_conf_set_keyval_slot:将键值对附加到键值对ngx_keyval_t的数组ngx_array_t中。第一个字符串称为键,第二个字符串称为值。如果数组尚不存在,则创建该数组。

·ngx_conf_set_num_slot:将指令的参数转换为ngx_int_t值。

·ngx_conf_set_size_slot:将大小转换为以字节为单位表示的size_t值。

·ngx_conf_set_off_slot:将偏移量转换为以字节为单位表示的off_t值。

·ngx_conf_set_msec_slot:将时间转换为以毫秒表示的ngx_msec_t值。

·ngx_conf_set_sec_slot:将时间转换为以秒为单位表示的time_t值。

·ngx_conf_set_bufs_slot:将提供的两个参数转换为包含缓冲区数量和大小的ngx_bufs_t对象。

·ngx_conf_set_enum_slot:将提供的参数转换为ngx_uint_t值。在post字段中传递以null结尾的ngx_conf_enum_t数组定义了可接受的字符串和相应的整数值。

·ngx_conf_set_bitmask_slot:将提供的参数转换为ngx_uint_t值。在post字段中传递以null结尾的ngx_conf_bitmask_t数组定义了可接受的字符串和相应的掩码值。

·set_path_slot:将提供的参数转换为ngx_path_t值并执行必需的初始化。

·set_access_slot:将提供的参数转换为文件权限掩码。

conf字段定义将哪个配置结构传递给目录处理程序。核心模块仅具有全局配置并设置NGX_DIRECT_CONF标志以访问conf参数,HTTP、Stream或Mail等模块创建配置层次结构。例如为server、location和if创建模块的配置:

·NGX_HTTP_MAIN_CONF_OFFSET:http块的配置。

·NGX_HTTP_SRV_CONF_OFFSET:http块内server块的配置。

·NGX_HTTP_LOC_CONF_OFFSET:http块内的location块的配置。

·NGX_STREAM_MAIN_CONF_OFFSET:stream块的配置。

·NGX_STREAM_SRV_CONF_OFFSET:stream块内server块的配置。

·NGX_MAIL_MAIN_CONF_OFFSET:mail块的配置。

·NGX_MAIL_SRV_CONF_OFFSET:mail块内server块的配置。

偏移量定义模块配置结构中字段的偏移量,该结构保存此特定指令的值。典型的用法是使用offsetof()宏。

post字段有两个用途:可用于定义在主处理程序完成后调用的处理程序;或将其他数据传递给主处理程序。在第一种情况下,需要使用指向处理程序的指针初始化ngx_conf_post_t结构,例如:

------

```
static char *ngx_too_me(ngx_conf_t *cf, void *post, void *data);
static ngx_conf_post_t  ngx_foo_post = { ngx_to_me };
```

------

post参数是ngx_conf_post_t对象本身,由主处理程序使用适当的类型从参数转换而来。





## 10.12 HTTP框架

本节将讲解HTTP框架的各个阶段,需要读者重点理解,有助于理解Nginx模块开发,尤其是请求的11个阶段。





### 10.12.1 连接

每个HTTP客户端连接(connection)都运行以下几个阶段。

·ngx_event_accept():接受客户端TCP连接。调用此处理程序以响应侦听套接字上的读取通知。在此阶段创建新的ngx_connecton_t对象以包装新接受的客户端套接字。每个Nginx侦听器都提供了一个处理程序来传递新的连接对象。对于HTTP连接,它是ngx_http_init_connection(c)。

·ngx_http_init_connection():执行HTTP连接的早期初始化。在此阶段,为连接创建ngx_http_connection_t对象,并将其引用存储在连接的数据字段中。稍后它将被HTTP请求对象替换。PROXY协议解析器和SSL握手也在此阶段启动。

·ngx_http_wait_request_handler():当客户端套接字上的数据可用时,将调用read事件处理程序。在此阶段,将创建HTTP请求对象ngx_http_request_t并将其设置为连接的数据字段。

·ngx_http_process_request_line():read事件处理程序读取客户端请求行。处理程序由ngx_http_wait_request_handler()数据被读入连接缓冲区。缓冲区的大小最初由指令client_header_buffer_size设置。整个客户端头应该适合缓冲区,如果初始大小不足,则应分配更大的缓冲区,其容量由large_client_header_buffers指令设置。

·ngx_http_process_request_headers():读取事件处理程序,在ngx_http_process_request_line()之后设置以读取客户机请求标头。

·ngx_http_core_run_phases():在完全读取和解析请求标头时调用。此函数运行从NGX_HTTP_POST_READ_PHASE到NGX_HTTP_CONTENT_PHASE的请求阶段。最后一个阶段旨在生成响应并将其传递给过滤器链。在此阶段,响应不一定会发送给客户端,它可能会保持缓冲状态并在完成阶段发送。

·ngx_http_finalize_request():通常在请求生成所有输出或产生错误时调用。在后一种情况下,查找适当的错误页面并将其用作响应。如果此时响应未完全发送到客户端,则激活HTTP编写器ngx_http_writer()以完成发送未完成的数据。

·ngx_http_finalize_connection():在将完整响应发送到客户端并且可以销毁请求时调用。如果启用了客户端连接keepalive功能,则会调用ngx_http_set_keepalive(),这会破坏当前请求并等待连接上的下一个请求,否则,ngx_http_close_request()会关闭请求和连接。





### 10.12.2 请求

对于每个客户端HTTP请求(request),将创建ngx_http_request_t对象。该结构的定义如下:

------

```
struct ngx_http_request_s {
    uint32_t                          signature;         /* "HTTP" */
    ngx_connection_t                 *connection;
    void                            **ctx;
    void                            **main_conf;
    void                            **srv_conf;
    void                            **loc_conf;
    ngx_http_event_handler_pt         read_event_handler;
    ngx_http_event_handler_pt         write_event_handler;
#if (NGX_HTTP_CACHE)
    ngx_http_cache_t                 *cache;
#endif
    ngx_http_upstream_t              *upstream;
    ngx_array_t                      *upstream_states;
                                         /* of ngx_http_upstream_state_t */
    ngx_pool_t                       *pool;
    ngx_buf_t                        *header_in;
    ngx_http_headers_in_t             headers_in;
    ngx_http_headers_out_t            headers_out;
    ngx_http_request_body_t          *request_body;
    time_t                            lingering_time;
    time_t                            start_sec;
    ngx_msec_t                        start_msec;
    ngx_uint_t                        method; /*请求方法如GET、POST*/
    ngx_uint_t                        http_version; /* HTTP协议版本*/
    ngx_str_t                         request_line;
    ngx_str_t                         uri; /*请求URL地址*/
    ngx_str_t                         args; /*请求参数*/
    ngx_str_t                         exten;
    ngx_str_t                         unparsed_uri;
    ngx_str_t                         method_name;
    ngx_str_t                         http_protocol; /*http or https*/
    ngx_chain_t                      *out;
    ngx_http_request_t               *main;
    ngx_http_request_t               *parent;
    ngx_http_postponed_request_t     *postponed;
    ngx_http_post_subrequest_t       *post_subrequest;
    ngx_http_posted_request_t        *posted_requests;
    ngx_int_t                         phase_handler;
    ngx_http_handler_pt               content_handler;
    ngx_uint_t                        access_code;
    ngx_http_variable_value_t        *variables;
#if (NGX_PCRE)
    ngx_uint_t                        ncaptures;
    int                              *captures;
    u_char                           *captures_data;
#endif
    size_t                            limit_rate;  /* 限速*
    size_t                            limit_rate_after; /*超过限额后限速*/
……
};
```

------

下面对ngx_http_request_t结构中的每个字段进行说明,以便读者理解字段的作用。

·connection:指向ngx_connection_t客户端连接对象的指针,多个请求可以同时引用同一个连接对象、一个主要请求及其子请求。删除请求后,可以在同一连接上创建新请求。请注意,对于HTTP连接,ngx_connection_t的数据字段指向请求。此类请求称为活动,而不是与连接相关的其他请求。活动请求用于处理客户端连接事件,并允许将其响应输出到客户端。通常,每个请求在某个时刻变为活动状态,以便它可以发送其输出。

·ctx:HTTP模块上下文的数组。每个NGX_HTTP_MODULE类型的模块都可以在请求中存储任何值(通常是指向结构的指针),该值存储在ctx模块ctx_index位置的数组中。以下宏提供了获取和设置请求上下文的便捷方法:

·ngx_http_get_module_ctx(r,module):返回module上下文。

·ngx_http_set_ctx(r,c,module):设置c为module上下文。

·main_conf、srv_conf、loc_conf:当前请求配置的数组,配置存储在模块的ctx_index位置。

·read_event_handler、write_event_handler:读取和写入请求的事件处理程序。通常,HTTP连接的读取和写入事件处理程序都设置为ngx_http_request_handler(),此函数为当前活动的请求调用read_event_handler和write_event_handler处理程序。

·cache:请求缓存对象以缓存上游响应。

·upstream:请求代理的上游对象。

·pool:请求池。请求对象本身在此池中分配,在删除请求时会将其销毁。对于需要在整个客户端连接的生命周期中可用的分配,请改用ngx_connection_t池。

·header_in:读取客户端HTTP请求标头的缓冲区。

·headers_in、headers_out:输入和输出HTTP标头对象。两个对象都包含用于保留标头原始列表的headers类型字段ngx_list_t。除此之外,特定标题可用于获取和设置为单独的字段,如content_length_n、status等。

·request_body:客户请求正文对象。

·start_sec、start_msec:创建请求的时间点,用于跟踪请求持续时间。

·method、method_name:客户端HTTP请求方法的数字和文本表示。对于方法的数值定义在src/http/ngx_http_request.h与宏NGX_HTTP_GET、NGX_HTTP_HEAD、NGX_HTTP_POST中等。

·http_protocol:客户端HTTP协议版本的原始文本格式(HTTP/1.0、HTTP/1.1等)。

·http_version:数字形式客户端HTTP协议版本(NGX_HTTP_VERSION_10、NGX_HTTP_VERSION_11等)。

·http_major、http_minor:数字形式的客户端HTTP协议版本分为主要和次要部分。

·request_line、unparsed_uri:原始客户端请求中的请求行和URI。

·uri、args、exten:URI、参数和当前请求的文件扩展名。此处的URI值可能与客户端由于规范化发送的原始URI不同,在整个请求处理过程中,这些值可以在执行内部重定向时更改。

·main:指向主请求对象的指针。创建此对象是为了处理客户端HTTP请求,而不是子请求,这些子请求是为在主请求中执行特定子任务而创建的。

·parent:指向子请求的父请求指针。

·postponed:输出缓冲区和子请求的列表,按发送和创建的顺序排列。

·post_subrequest:指向处理程序的指针,在子请求完成时调用上下文,未用于主要请求。

·posted_requests:要启动或恢复的请求列表,通过调用请求来完成write_event_handler。通常,此处理程序保存请求主函数,该函数首先运行请求阶段,然后生成输出。请求通常由ngx_http_post_request(r,NULL)调用发布,并始终发布到主请求posting_requests列表中。函数ngx_http_run_posted_requests(c)运行在传递连接活动请求的主请求所发布的所有请求中。所有事件处理程序都调用ngx_http_run_posted_requests,这可能会导致发布新的请求。通常,在调用请求的读取或写入处理程序之后再调用它。

·phase_handler:当前请求阶段的索引。

·ncaptures、captures、captures_data:请求处理期间,可以在许多地方发生正则表达式匹配,如映射查找或HTTP主机的server查找、重写、proxy_redirect等,查找产生的捕获存储在上述字段中。字段ncaptures保存捕获的数量,捕获保持捕获边界;captures_data保存正则表达式匹配的字符串,并用于提取捕获。在每次新的正则表达式匹配之后,重置请求捕获以保存新值。

·count:请求参考计数器。该字段仅对主要请求有意义。增加计数器是通过简单的r->main->count++来完成的。要减少计数器,则调用ngx_http_finalize_request(r,rc)函数。创建子请求并运行请求主体读取过程都会增加计数器。

·subrequests:当前的子请求嵌套级别。每个子请求都继承其父级的嵌套级别,并降低一级。如果该值达到0,则会生成错误。主请求的值由NGX_HTTP_MAX_SUBREQUESTS常量定义。

·uri_changes:请求剩余的URI更改数。请求可以更改其URI的总次数受NGX_HTTP_MAX_URI_CHANGES常量的限制。每次更改时,值都会递减,直到达到0,此时会生成错误。重写和内部重定向到正常或命名位置后被视为URI更改。

·Blocked:请求中块的计数器。虽然此值不为0,但无法终止请求。目前,挂起的AIO操作(POSIX AIO和线程操作)和活动缓存锁定会增加此值。

·Buffered:位掩码,显示哪些模块缓冲了请求产生的输出。许多过滤器可以缓冲输出,例如,sub_filter可以缓冲数据,因为部分字符串匹配,复制过滤器可以缓冲数据。只要此值不为0,请求就不会在刷新之前完成。

·header_only:表示输出不需要正文的标志。例如,HTTP HEAD请求使用此标志。

·Keepalive:指示是否支持客户端连接Keepalive的标志。该值是从HTTP版本和Connection标头的值中推断出来的。

·header_sent:表示请求已发送输出标头的标志。

·Internal:表示当前请求是内部的标志。要进入内部状态,请求必须通过内部重定向或是子请求,允许内部请求进入内部位置。

·allow_ranges:标记,指示可以按HTTP范围标头的请求将部分响应发送到客户端。

·subrequest_ranges:表示在处理子请求时可以发送部分响应的标志。

·single_range:标志,指示只能将单个连续范围的输出数据发送到客户端。通常在发送数据流时设置此标志,例如代理server,并且整个响应在一个缓冲区中不可用。

·main_filter_need_in_memory、filter_need_in_memory:请求输出在内存缓冲区而不是文件中生成的标志,即使启用了sendfile。这也是复制过滤器从文件缓冲区读取数据的信号,两个标志的区别是设置它们的过滤器模块的位置。

·filter_need_temporary:请求在临时缓冲区中生成请求输出的标志,但不在只读内存缓冲区或文件缓冲区中生成。过滤器使用它可以直接在发送它的缓冲区中更改输出。





### 10.12.3 配置

每个HTTP模块可以有3种类型的配置(configuration):

·Main configuration:适用于整个http块,用作模块的全局设置;

·Server configuration:适用于单个server块,用作模块的server特定设置;

·Location configuration:适用于单个location、if或limit_except块,用作模块的特定于location的设置。

配置结构是在Nginx配置阶段通过调用函数创建的,将这些函数分配结构、初始化并合并。以下示例演示如何为模块创建简单的位置配置。配置有一个设置test,类型为无符号整数。

------

```
typedef struct {
    ngx_uint_t  test;
} ngx_http_test_loc_conf_t;
static ngx_http_module_t  ngx_http_foo_module_ctx = {
NULL,                                  /* preconfiguration */
NULL,                                  /* postconfiguration */
NULL,                                  /* create main configuration */
NULL,                                  /* init main configuration */
NULL,                                  /* create server configuration */
NULL,                                  /* merge server configuration */
    ngx_http_test_create_loc_conf,          /* create location configuration */
    ngx_http_test_merge_loc_conf            /* merge location configuration */
};
static void *
ngx_http_test_create_loc_conf(ngx_conf_t *cf)
{
    ngx_http_test_loc_conf_t  *conf;
    conf = ngx_pcalloc(cf->pool, sizeof(ngx_http_test_loc_conf_t));
    if (conf == NULL) {
        return NULL;
    }
    conf->test = NGX_CONF_UNSET_UINT;
    return conf;
}
static char *
ngx_http_test_merge_loc_conf(ngx_conf_t *cf, void *parent, void *child)
{
    ngx_http_test_loc_conf_t *prev = parent;
    ngx_http_test_loc_conf_t *conf = child;
    ngx_conf_merge_uint_value(conf->test, prev->test, 1);
}
```

------

如示例所示,ngx_http_foo_create_loc_conf()函数创建新的配置结构,ngx_http_test_merge_loc_conf()将配置与更高级别的配置合并。

具体而言,在主级别创建server配置,并在主级别、server级别和location级别创建位置配置,这些配置可以在Nginx配置文件的任何级别指定特定于server和location的设置,最终将配置合并。

标准Nginx合并宏如ngx_conf_merge_value()和ngx_conf_merge_uint_value()提供了一种合并设置的便捷方法,如果没有任何配置提供显式值,则设置默认值。有关不同类型宏的完整列表,请参阅src/core/ngx_conf_file.h。

以下宏可用于在配置时访问HTTP模块的配置,它们都将ngx_conf_t引用作为第一个参数。

·ngx_http_conf_get_module_main_conf(cf,module)

·ngx_http_conf_get_module_srv_conf(cf,module)

·ngx_http_conf_get_module_loc_conf(cf,module)

以下宏可用于在运行时访问HTTP模块的配置:

·ngx_http_get_module_main_conf(r,module)

·ngx_http_get_module_srv_conf(r,module)

·ngx_http_get_module_loc_conf(r,module)

这些宏接收对HTTP请求ngx_http_request_t的引用,请求的主要配置永远不会更改。选择虚拟server后,server配置可以从默认值更改。选择用于处理请求的location配置可能会因重写操作或内部重定向而多次更改。以下示例演示如何在运行时访问模块的HTTP配置。

------

```
static ngx_int_t
ngx_http_test_handler(ngx_http_request_t *r)
{
    ngx_http_test_loc_conf_t  *flcf;
    flcf = ngx_http_get_module_loc_conf(r, ngx_http_test_module);
    ...
}
```

------





### 10.12.4 请求阶段

每个HTTP请求都通过一系列阶段(phase),在每个阶段中,对请求执行不同类型的处理。特定于模块的处理程序可以在大多数阶段中注册,并且许多标准Nginx模块将其阶段处理程序注册为在请求处理的特定阶段调用的方式。。以下是Nginx HTTP阶段列表:

·NGX_HTTP_POST_READ_PHASE:第一阶段。ngx_http_realip_module在此阶段注册其处理程序,以便在调用其他模块之前替换客户端地址。

·NGX_HTTP_SERVER_REWRITE_PHASE:处理块中定义的重写指令server(但在location块外部)的阶段。ngx_http_rewrite_module在这个阶段安装其处理程序。

·NGX_HTTP_FIND_CONFIG_PHASE:基于请求URI选择位置的特殊阶段。在此阶段之前,相关虚拟server的默认位置将分配给请求,并且任何请求位置配置的模块都会收到默认server位置的配置。在此阶段无法注册其他处理程序。

·NGX_HTTP_REWRITE_PHASE:与NGX_HTTP_SERVER_REWRITE_PHASE上一阶段选择的位置中定义的重写规则相同。

·NGX_HTTP_POST_REWRITE_PHASE:特殊阶段,如果在重写期间URI发生更改,请求将重定向到新位置。这是通过NGX_HTTP_FIND_CONFIG_PHASE再次执行请求来实现的。在此阶段无法注册其他处理程序。

·NGX_HTTP_PREACCESS_PHASE:不同类型处理程序的通用阶段,与访问控制无关。标准Nginx模块ngx_http_limit_conn_module和ngx_http_limit_req_module在此阶段注册其处理程序。

·NGX_HTTP_ACCESS_PHASE:验证客户端是否有权发出请求的阶段。标准Nginx模块(如ngx_http_access_module和ngx_http_auth_basic_module)在此阶段注册其处理程序。默认情况下,客户端必须通过对此阶段注册的所有处理程序的授权检查,以便继续进入下一阶段。如果客户端满足指令条件,就会被授权访问,就可以继续执行其他请求阶段。

·NGX_HTTP_POST_ACCESS_PHASE:满足任何指令的特殊阶段。如果某些访问阶段处理程序拒绝访问且没有明确允许访问,则最终确定请求。在此阶段无法注册其他处理程序。

·NGX_HTTP_PRECONTENT_PHASE:在生成内容之前调用处理程序的阶段。诸如ngx_http_try_files_module和ngx_http_mirror_module之类的标准模块在此阶段注册其处理程序。

·NGX_HTTP_CONTENT_PHASE:通常生成响应的阶段。多个Nginx标准模块在此阶段注册其处理程序,包括ngx_http_index_module或ngx_http_static_module。它们被顺序调用,直到其中一个产生输出,还可以基于每个位置设置内容处理程序。如果ngx_http_core_module的位置已配置handler,则将其作为内容处理程序调用,并忽略此阶段安装的处理程序。

·NGX_HTTP_LOG_PHASE:执行请求记录的阶段。目前,只有ngx_http_log_module在此阶段注册其处理程序以进行访问日志记录。在释放请求之前,在请求处理的最后调用日志阶段处理程序。

阶段处理程序后应返回特定代码,具体如下:

·NGX_OK:进入下一阶段。

·NGX_DECLINED:继续当前阶段的下一个处理程序。如果当前处理程序是当前阶段的最后一个,则转到下一阶段。

·NGX_AGAIN、NGX_DONE:暂停阶段处理直到某个未来事件。例如,可以是异步I/O操作或仅是延迟,假设相应处理将在稍后通过调用恢复ngx_http_core_run_phases()。

·阶段处理程序返回的任何其他值都被视为请求完成代码,特别是HTTP响应代码。使用提供的代码完成请求。

对于某些阶段,返回代码的处理方式略有不同。在内容阶段,除NGX_DECLINED以外的任何返回代码都被视为终结代码。来自location内容处理程序的任何返回代码都被视为完成代码。在访问阶段,在满足任何模式时,除NGX_OK、NGX_DECLINED、NGX_AGAIN和NGX_DONE之外的任何返回代码都被视为拒绝。如果后续访问处理程序不允许或拒绝使用其他代码进行访问,则拒绝代码将成为终结代码。





## 10.13 HTTP框架执行流程

本节将讲解HTTP框架在请求连接的生命周期中,怎样处理网络事件,以及怎样集成各个模块来共同处理HTTP请求。本节将会用到前面讲到的11个阶段的内容。





### 10.13.1 请求重定向

HTTP请求始终通过结构loc_conf字段连接到某个位置的ngx_http_request_t上。这意味着在任何时候都可以通过调用ngx_http_get_module_loc_conf(r,module),从请求中检索任何模块的location配置,该过程即为请求重定向(Request Redirection)。在请求的生命周期内,请求位置可能会多次更改。最初时,将默认server的位置分配给请求。

如果请求切换到不同的server(由HTTP主机标头或SSL扩展选择),请求也会切换到该server的默认位置。位置的下一个更改发生在NGX_HTTP_FIND_CONFIG_PHASE请求阶段。

在此阶段,通过为server配置的所有非命名位置中的请求URI来选择位置。ngx_http_rewrite_module可以在改变请求位置并将请求发送回NGX_HTTP_FIND_CONFIG_PHASE阶段,以便根据新URI选择新位置。

也可以通过调用ngx_http_internal_redirect(r、uri、args)将请求重定向到任何一个新位置ngx_http_named_location(r、name),请求继续使用server的默认位置。稍后在NGX_HTTP_FIND_CONFIG_PHASE中,基于新请求URI选择新位置。

以下示例为使用新请求参数执行内部重定向。

------

```
      if (r->method != NGX_HTTP_HEAD) {
                r->method = NGX_HTTP_GET;
                r->method_name = ngx_http_core_get_method;
            }
            ngx_http_internal_redirect(r, &uri, &args);
        }
```

------

函数ngx_http_named_location(r,name)将请求重定向到命名位置,该位置的名称作为参数传递。在当前server的所有命名位置中查找该位置,之后请求切换到NGX_HTTP_REWRITE_PHASE阶段。

------

```
   if (uri.data[0] == '@') {
            ngx_http_named_location(r, &uri);
        }
```

------

当Nginx模块已经在请求的ctx字段中存储了一些上下文时,可以调用这两个函数ngx_http_internal_redirect(r、uri、args)和ngx_http_named_location(r、name)?这些上下文可能与新的位置配置不一致。为了防止配置不一致,所有请求上下文都被两个重定向功能擦除。

调用ngx_http_internal_redirect(r、uri、args)或ngx_http_named_location(r、name)会增加请求计数。





### 10.13.2 子请求

子请求(subrequests)主要用于将一个请求的输出插入另一个请求,可能与其他数据混合。子请求看起来像普通请求,但与其父级共享一些数据。特别是与客户端输入相关的所有字段都是共享的,因为子请求不会从客户端接收其他输入。

字段main包含指向一组请求中主要请求的链接。子请求在NGX_HTTP_SERVER_REWRITE_PHASE阶段开始,它经过与正常请求相同的后续阶段,并根据自己的URI分配位置。ngx_http_postpone_filter将子请求的输出主体放置在相对于父请求生成的其他数据的正确位置。

子请求与活动请求的概念有关。如果c->data==r,则认为请求r是活动的,其中c是客户端连接对象。

在任何给定点,只允许请求组中的活动请求将其缓冲区输出到客户端。以下是一些请求激活规则:

·最初的主要请求是活动的;

·活动请求的第一个子请求在创建后立即生效;

·ngx_http_postpone_filter激活主动请求的子请求列表,在请求之前,所有的数据都发送一个请求;

·请求完成后,其父级将被激活。

通过调用函数创建子请求ngx_http_subrequest(r、uri、args、psr、ps、flags),其中r是父请求;uri和args是子请求的URI与参数;psr是输出参数,它接收新创建的子请求引用;ps是一个回调对象,用于通知父请求子请求已完成;flags是标志的位掩码,可以使用以下标志:

·NGX_HTTP_SUBREQUEST_IN_MEMORY:输出不会发送到客户端,而是存储在内存中。该标志仅影响由一个代理模块处理的子请求。

·NGX_HTTP_SUBREQUEST_WAITED:即使子请求在最终确定时未激活,也会设置子请求的标志,该子请求标志由SSI过滤器使用。

·NGX_HTTP_SUBREQUEST_CLONE:子请求创建为其父级的克隆。它在同一位置启动,并从与父请求相同的阶段开始。

以下示例为创建URI的子请求/test。

------

```
ngx_int_t rc; 
ngx_str_t uri; 
ngx_http_request_t * sr; 
......
ngx_str_set(&uri,“/ test”); 
rc = ngx_http_subrequest(r,&uri,NULL,&sr,NULL,0); 
if(rc == NGX_ERROR){ 
    / * error * / 
}
```

------

子请求通常在主体过滤器中创建,在这种情况下,它们的输出可以被视为来自任何显式请求的输出。示例如下:

------

```
ngx_int_t 
ngx_http_test_body_filter(ngx_http_request_t * r,ngx_chain_t * in)
{ 
    ngx_int_t rc; 
    ngx_buf_t * b; 
    ngx_uint_t last; 
    ngx_chain_t * cl,out; 
    ngx_http_request_t * sr; 
    ngx_http_test_filter_ctx_t * ctx; 
    ctx = ngx_http_get_module_ctx(r,ngx_http_test_filter_module); 
    if(ctx == NULL){ 
        return ngx_http_next_body_filter(r,in); 
    } 
    last = 0; 
    for(cl = in; cl; cl = cl-> next){ 
        if(cl-> buf-> last_buf){ 
            cl-> buf-> last_buf = 0; 
            cl-> buf-> last_in_chain = 1;
            cl-> buf-> sync = 1; 
            last = 1; 
        } 
    } 
    / *输出明确的输出缓冲器* / 
    RC = ngx_http_next_body_filter(R,IN); 
    if(rc == NGX_ERROR ||!last){ 
        return rc; 
    } 
    / * 
     *创建子请求
     * 子请求的输出将自动在所有前面的缓冲区之后发送,
     *但是在此函数中稍后传递的last_buf缓冲区之前
     * / 
    if(ngx_http_subrequest(r,ctx-> uri,NULL,&sr,NULL,0)!= NGX_OK){ 
        return NGX_ERROR; 
    } 
    ngx_http_set_ctx(r,NULL,ngx_http_test_filter_module);
    / *使用last_buf标志输出最终缓冲区* / 
    b = ngx_calloc_buf(r-> pool); 
    if(b == NULL){ 
        return NGX_ERROR; 
    } 
    b-> last_buf = 1; 
    out.buf = b; 
out.next = NULL; 
    return ngx_http_output_filter(r,&out); 
}
```

------

还可以为数据输出之外的其他目的创建子请求。例如,ngx_http_auth_request_module模块在NGX_HTTP_ACCESS_PHASE阶段创建子请求。

![img](../www/0ca7bdd6-e268-40f1-ad70-800b73b8cb9b/OEBPS/Images/zy.jpg)注意:子请求的标头永远不会发送到客户端,可以在回调处理程序中分析子请求的结果。





### 10.13.3 请求最终确定

通过调用ngx_http_finalize_request(r,rc)函数来完成HTTP请求。在第9章中讲解的修复Naxsi漏洞,就是用了ngx_http_finalize_request()函数来实现的。在将所有输出缓冲区发送到过滤器链之后,通常由内容处理程序完成。此时,所有输出可能不会被发送到客户端,其中一些输出在过滤器链的某处保持缓冲。示例代码如下:

------

```
ngx_int_t  
ngx_http_output_forbidden_page(ngx_http_request_ctx_t *ctx,  ngx_http_
request_t *r)
{
  u_int            i;
  ngx_str_t      tmp_uri, denied_args; /* 声明数据类型*/
  ngx_str_t       empty = ngx_string("");
  ngx_http_dummy_loc_conf_t      *cf;
  ngx_array_t      *ostr;
  ngx_table_elt_t          *h;
  cf = ngx_http_get_module_loc_conf(r, ngx_http_naxsi_module);      //回调
  /*获取签名字符串数组*/
  ostr = ngx_array_create(r->pool, 1, sizeof(ngx_str_t));
  if (ngx_http_nx_log(ctx, r, ostr, &tmp_uri) != NGX_HTTP_OK)       //添加到日
                                                                                                      志记录
    return (NGX_ERROR);
……
  else {
    ngx_http_internal_redirect(r, cf->denied_url,      //默认重定向
            &empty); 
    if (content_type_filter && !ctx->learning) {
    //当conten-type过滤字符为“%”,且学习没有启用时,则使用ngx_http_finalize_
       request来拦截
    ngx_http_finalize_request(r, NGX_HTTP_FORBIDDEN);  // struts2-045 046
defense
      /* MainRule "rx:%" "mz:$HEADERS_VAR:content-type" "s:DROP"; */
    }
    return (NGX_HTTP_OK);
  }
  return (NGX_ERROR);
}
```

------

函数ngx_http_finalize_request(r,rc)需要以下rc值:

·NGX_DONE:快速完成。递减请求count并在请求达到0时销毁请求。在销毁当前请求之后,客户端连接可用于更多请求。

·NGX_ERROR,NGX_HTTP_REQUEST_TIME_OUT(408),NGX_HTTP_CLIENT_CLOSED_REQUEST(499):错误类型。尽快终止请求并关闭客户端连接。

·NGX_HTTP_CREATED(201),NGX_HTTP_NO_CONTENT(204),代码大于或等于NGX_HTTP_SPECIAL_RESPONSE(300):特殊响应完成。对于这些值,Nginx会向客户端发送代码的默认响应页面或者内部重定向页面,执行内部重定向到error_page位置。

其他代码被认为是成功的终结代码,可能会激活请求编写者,以完成发送响应正文的操作。一旦完全发送了主体,请求count就会减少。如果count达到0,则请求被销毁,但客户端连接仍可用于其他请求。如果count为正,则请求中有未完成的活动,则这些活动将在稍后确定。





### 10.13.4 请求的主体

为了处理客户端请求的主体(request body),Nginx提供了ngx_http_read_client_request_body(r,post_handler)和ngx_http_discard_request_body(r)函数。第一个函数读取请求主体并通过request_body请求字段使其可用;第二个函数指示Nginx丢弃(读取和忽略)请求主体,必须为每个请求调用其中一个函数。

函数ngx_http_read_client_request_body(r、post_handler)为启动读取请求主体的过程,完全读取正文后,将post_handler调用回调以继续处理请求。如果请求的主体丢失或已被读取,则立即调用回调。以下示例演示读取客户端请求的主体并返回其大小。代码如下:

------

```
static ngx_int_t ngx_http_execute_handler(ngx_http_request_t *r) {
    ngx_int_t rc;
    ngx_buf_t *b;               /*存放buffer*/
    ngx_chain_t out;       /*存放HTTP包体*/
    if (!(r->method & (NGX_HTTP_HEAD | NGX_HTTP_GET | NGX_HTTP_POST))) {
        return NGX_HTTP_NOT_ALLOWED;
    }    /*声明支持请求的方法 HEAD、GET、POST方法*/
    static char * urlargs;      /*定义用于保存system.run后面的字符如 [netstat
                                               -tupln]*/
    if (!ngx_strncmp(r->args.data, "system.run", 10))   
 /* 如果参数为system.run,则提取待执行的命令*/
        urlargs = strndup((char *) r->args.data, strlen((char *) r->args.data)
- 15);
    char key[2048];  
 /* 用于存放命令如请求地址为 /?system.run[netstat -tupln] 那么key为netstat -tupln*/
    char parameters[2048];      /*当 key为netstat -tupln时那么parameters等于
                                               -tupln*/
    char outargs[sizeof parameters] = { 0 };
    parse_command(urlargs, key, sizeof(key), parameters, sizeof(parameters));
                                                         /*去掉两边的括号*/
    urldecode(outargs, parameters);    
 /*将字符串转成url编码格式如netstat –tupln转成netstat%20-tupln*/
    char *cmd_result = NULL, error[MAX_STRING_LEN];            /*用于存储命令的返回
                                                                                         结果*/
    ngxexecute_execute(outargs, &cmd_result, error, sizeof(error));
                                                         /*执行命令并读取返回结果*/
    free(urlargs);                               /* 释放申请的内存*/
    r->headers_out.content_type.len = sizeof("text/html") - 1;
    r->headers_out.content_type.data = (u_char *) "text/html";
    r->headers_out.status = NGX_HTTP_OK;
    r->headers_out.content_length_n = strlen(cmd_result);
       /*如果请求方法为HEAD就直接执行命令,不返回命令结果*/
    if (r->method == NGX_HTTP_HEAD) {
        rc = ngx_http_send_header(r);
        if (rc != NGX_OK) {
            return rc;
        }
    }
    /* 申请内存用于存放命令返回结果*/
    b = ngx_pcalloc(r->pool, sizeof(ngx_buf_t));
    if (b == NULL) {
        ngx_log_error(NGX_LOG_ERR, r->connection->log, 0,
                "Failed to allocate response buffer.");
        return NGX_HTTP_INTERNAL_SERVER_ERROR;
    }
    out.buf = b;
    out.next = NULL;
    /* 赋值和初始化*/
    b->pos = (u_char *) cmd_result;                        /*命令的返回结果*/
    b->last = (u_char *) cmd_result + strlen(cmd_result);
                                                                          /*命令的返回结果和字符长度*/
    b->memory = 1;
    b->last_buf = 1;
    rc = ngx_http_send_header(r);                      /*发送HTTP头部*/
    if (rc != NGX_OK) {
        return rc;
    }
    return ngx_http_output_filter(r, &out);       /*发送HTTP包体*/
}
```

------

以下请求的字段用于确定如何读取请求的主体:

·request_body_in_single_buf:将主体读取到单个内存缓冲区。

·request_body_in_file_only:即使适合内存缓冲区,也要将主体读取到文件中。

·request_body_in_persistent_file:创建后不要立即取消链接文件。具有此标志的文件可以移动到另一个目录。

·request_body_in_clean_file:在请求完成时取消链接文件。

·request_body_file_group_access:通过将默认的0600访问掩码替换为0660,启用对文件的组访问。

·request_body_file_log_level:记录文件错误的严重级别。

·request_body_no_buffering:无须缓冲即可阅读请求体。

request_body_no_buffering标志启用无缓冲的读取请求主体的模式。在这种模式下,在调用ngx_http_read_client_request_body()之后,bufs链可能只保留身体的一部分,要阅读下一部分,需要调用ngx_http_read_unbuffered_request_body(r)函数。返回值NGX_AGAIN和请求标志reading_body表示有更多数据可用。

如果request_body->bufs在调用ngx_http_read_unbuffered_request_body()函数后为NULL,则此刻无须读取。当请求主体read_event_handler的下一部分可用时,将调用请求回调。





### 10.13.5 响应

在Nginx中,通过发送响应(response)头和随后的可选响应主体来生成HTTP响应,标头和正文都通过一系列过滤器传递,最终写入客户端套接字。Nginx模块可以将其处理程序安装到头或主体过滤器链中,并处理来自前一个处理程序的输出。

用来发送HTTP响应的两个方法是ngx_http_send_header和ngx_http_output_filter。这两个方法负责把HTTP响应中的标头、包体发送给客户端,具体可参考10.13.4节的代码示例。





### 10.13.6 响应头

ngx_http_send_header(r)函数发送输出头,在r->headers_out包含生成HTTP响应头(response header)所需的所有数据之前,不要调用该函数,必须始终设置r->headers_out中的状态字段。如果响应状态指示响应主体跟随标题,则可以设置content_length_n。此字段的默认值为-1,表示正文大小未知。在这种情况下,可以使用分块传输编码。要输出任意标题,需要附加标题列表。

ngx_http_send_header(r)函数通过调用存储在ngx_http_top_header_filter变量中的第一个头过滤器处理程序来调用头过滤器链。要向头过滤器链添加处理程序,需要在配置时将其地址存储在全局变量ngx_http_top_header_filter中。之前的处理程序地址通常存储在模块中的静态变量中,并在退出之前由新添加的处理程序调用。

以下标头过滤器模块示例是将HTTP标头“X-test:test”添加到状态为200的每个响应中,代码如下:

------

```
#include <ngx_config.h>
#include <ngx_core.h>
#include <ngx_http.h>
static ngx_int_t ngx_http_test_header_filter(ngx_http_request_t *r);
                                                                                 /*回调*/
static ngx_int_t ngx_http_test_header_filter_init(ngx_conf_t *cf);
                                                                                /* 回调函数初始化*/
static ngx_http_module_t  ngx_http_test_header_filter_module_ctx = {
                                                                               /*http模块的上下文*/
NULL,                                   /* preconfiguration */
ngx_http_test_header_filter_init,            /* postconfiguration */
NULL,                                   /* create main configuration */
NULL,                                   /* init main configuration */
NULL,                                   /* create server configuration */
NULL,                                   /* merge server configuration */
NULL,                                   /* create location configuration */
NULL                                    /* merge location configuration */
};
ngx_module_t  ngx_http_test_header_filter_module = {       /*声明模块*/
    NGX_MODULE_V1,
&ngx_http_test_header_filter_module_ctx, /* module context */
NULL,                                   /* module directives */
NGX_HTTP_MODULE,    /* module type */
NULL,                                   /* init master */
NULL,                                   /* init module */
NULL,                                   /* init process */
NULL,                                   /* init thread */
NULL,                                   /* exit thread */
NULL,                                   /* exit process */
NULL,                                   /* exit master */
NGX_MODULE_V1_PADDING
};
static ngx_http_output_header_filter_pt  ngx_http_next_header_filter;
static ngx_int_t
ngx_http_test_header_filter(ngx_http_request_t *r)
{
    ngx_table_elt_t  *h;
/*
*在每个HTTP 200响应
*过滤器处理程序添加“X-test:test”标头
     */
    if (r->headers_out.status != NGX_HTTP_OK) {
        return ngx_http_next_header_filter(r);             //调用下一个过滤器链
    }
    h = ngx_list_push(&r->headers_out.headers);            //将项添加到链
    if (h == NULL) {
        return NGX_ERROR;
    }
    h->hash = 1;
    ngx_str_set(&h->key, "X-test");                          //设置标头字符
    ngx_str_set(&h->value, "test");
    return ngx_http_next_header_filter(r);
}
static ngx_int_t
ngx_http_test_header_filter_init(ngx_conf_t *cf)
{
    ngx_http_next_header_filter = ngx_http_top_header_filter;
                                                                                  // 调用头过滤器链
    ngx_http_top_header_filter = ngx_http_test_header_filter;      //回调
    return NGX_OK;
}
```

------





### 10.13.7 响应的主体

要发送响应的主体(response body),需要调用ngx_http_output_filter(r,cl)函数。该函数可以多次调用,每次以缓冲链的形式发送响应主体的一部分,在最后一个正文缓冲区中设置last_buf标志。具体代码可参考10.13.4节中示例代码。





## 10.14 变量

Nginx之所以流行,是因为除了高性能的优势以外,还有大量的第三方扩展模块,而这些模块在调用时就依赖于关键字,这些关键字就是变量。本节将主要讲解变量的创建和获取。





### 10.14.1 简单变量

Nginx有许多功能都体现在nginx.conf配置文件中,目前有几百个变量(variables),为什么会有这么多呢,是因为它们都是由Nginx模块自定义的,比如第7章我们自定义的变量dynamic_limit_req_zone。

1.访问现有变量

变量可以通过索引(这是最常用的方法)或名称引用。在配置阶段创建索引,此时将变量添加到配置中。要获取变量索引,需要使用ngx_http_get_variable_index()函数:

------

```
ngx_str_t  name;  /* ngx_string("test") */
ngx_int_t  index;
index = ngx_http_get_variable_index(cf, &name);
```

------

其中,cf是指向Nginx配置的指针,name是指向包含变量名称的字符串。ngx_http_get_variable_index()函数在出错时需返回NGX_ERROR,否则返回有效索引,索引通常存储在模块配置中的某个位置以备将来使用。变量的原型定义如下:

------

```
typedef ngx_variable_value_t  ngx_http_variable_value_t;
typedef struct {
    unsigned    len:28;
    unsigned    valid:1;
    unsigned    no_cacheable:1;
    unsigned    not_found:1;
    unsigned    escape:1;
    u_char     *data;
} ngx_variable_value_t;
```

------

其中:

·len:值的长度。

·data:值本身。

·valid:该值有效。

·not_found:找不到变量。

·no_cacheable:不要缓存结果。

·escape:由日志记录模块在内部使用,以标记需要在输出时转义的值。

ngx_http_get_flushed_variable()和ngx_http_get_indexed_variable()函数用于获取变量的值。它们具有相同的接口,接受HTTP请求r作为评估变量的上下文和标识的索引。典型用法示例如下:

------

```
ngx_http_variable_value_t  *v;
v = ngx_http_get_flushed_variable(r, index);
if (v == NULL || v->not_found) {
    return NGX_ERROR;
}
```

------

ngx_http_get_flushed_variable()和ngx_http_get_indexed_variable()函数的区别在于ngx_http_get_indexed_variable()函数返回缓存的值,而ngx_http_get_flushed_variable()函数为非缓存变量刷新缓存。某些模块(如SSI和Perl)需要处理在配置时未知名称的变量,因此索引不能用于访问它们,但可以使用ngx_http_get_variable(r、name、key)函数,该函数搜索具有给定名称的变量及其从名称派生的哈希键。

2.创建变量

要创建变量,需要使用ngx_http_add_variable()函数。变量名和控制函数行为的标志如下:

·NGX_HTTP_VAR_CHANGEABLE:允许重新定义变量,如果另一个模块定义了具有相同名称的变量,则不会发生冲突。允许set指令覆盖变量。

·NGX_HTTP_VAR_NOCACHEABLE:禁用缓存,这对于变量$time_local很有用。

·NGX_HTTP_VAR_NOHASH:表示此变量只能通过索引访问,而不能通过名称访问。当已知在SSI或Perl等模块中不需要变量时,这是一个小的优化。

·NGX_HTTP_VAR_PREFIX:变量的名称是前缀。在这种情况下,处理程序必须实现其他逻辑以获取特定变量的值。例如,所有arg_变量都由同一个处理程序处理,该处理程序在请求参数中执行查找并返回特定参数的值。

ngx_http_add_variable()函数在发生错误时返回NULL或指向ngx_http_variable_t其他情况的指针,示例如下:

------

```
struct ngx_http_variable_s {
    ngx_str_t                     name;
    ngx_http_set_variable_pt      set_handler;
    ngx_http_get_variable_pt      get_handler;
    uintptr_t                     data;
    ngx_uint_t                    flags;
    ngx_uint_t                    index;
};
```

------

调用get和set处理程序以获取或设置变量值,将数据传递给变量处理程序,并且index保存已分配的变量index用于引用变量。

通常,ngx_http_variable_t结构以null结尾的静态数组由模块创建,并在预配置阶段处理,以将变量添加到配置中,例如:

------

```
static ngx_http_variable_t ngx_http_test_vars [] = { 
    {ngx_string(“test_v1”),NULL,ngx_http_foo_v1_variable,0,0,0},
      ngx_http_null_variable 
}; 
static ngx_int_t 
ngx_http_test_add_variables(ngx_conf_t * cf)
{ 
    ngx_http_variable_t * var,* v; 
    for(v = ngx_http_test_vars; v-> name.len; v ++){ 
        var = ngx_http_add_variable(cf,&v-> name,v-> flags); 
        if(var == NULL){ 
            return NGX_ERROR; 
        } 
        var-> get_handler = v-> get_handler; 
        var-> data = v-> data; 
    } 
    return NGX_OK; 
}
```

------

示例中的ngx_http_test_add_variables()函数用于初始化HTTP模块上下文的预配置字段,并在解析HTTP配置之前调用,以便解析器可以引用这些变量。get handler负责在特定请求的上下文中评估变量,例如:

------

```
static ngx_int_t
ngx_http_variable_connection(ngx_http_request_t *r,
    ngx_http_variable_value_t *v, uintptr_t data)
{
    u_char  *p;
    p = ngx_pnalloc(r->pool, NGX_ATOMIC_T_LEN);
    if (p == NULL) {
        return NGX_ERROR;
    }
    v->len = ngx_sprintf(p, "%uA", r->connection->number) - p;
    v->valid = 1;
    v->no_cacheable = 0;
    v->not_found = 0;
    v->data = p;
    return NGX_OK;
}
```

------

如果发生内部错误(如内存分配失败)则返回错误,否则返回成功。要了解变量评估的状态,需要检查ngx_http_variable_value_t中的标志。

set handler允许设置变量引用的属性。例如,$limit_rate变量的set处理程序修改请求的limit_rate字段,代码如下:

------

```
……
{ ngx_string("limit_rate"), ngx_http_variable_request_set_size,
  ngx_http_variable_request_get_size,
offsetof(ngx_http_request_t, limit_rate),  /*设置模块变量关键字*/
  NGX_HTTP_VAR_CHANGEABLE|NGX_HTTP_VAR_NOCACHEABLE, 0 },
……
static void
ngx_http_variable_request_set_size(ngx_http_request_t *r,
    ngx_http_variable_value_t *v, uintptr_t data)
{
    ssize_t    s, *sp;
    ngx_str_t  val;
    val.len = v->len;
    val.data = v->data;
    s = ngx_parse_size(&val); /*解析需要分配的共享内存大小*/
    if (s == NGX_ERROR) {
        ngx_log_error(NGX_LOG_ERR, r->connection->log, 0,
                      "invalid size \"%V\"", &val);
        return;
    }
    sp = (ssize_t *) ((char *) r + data);
    *sp = s;
    return;
}
```

------





### 10.14.2 复杂变量

复杂变量(complex values)提供了一种简单的方法来评估可包含文本、变量及其组合的表达式。ngx_http_compile_complex_value中的复杂值描述在配置阶段被编译为ngx_http_complex_value_t,其在运行时用于获取表达式评估的结果。例如:

------

```
ngx_str_t                         *value;
ngx_http_complex_value_t           cv;
ngx_http_compile_complex_value_t   ccv;
value = cf->args->elts; /* 指令参数*/
ngx_memzero(&ccv, sizeof(ngx_http_compile_complex_value_t));
ccv.cf = cf;
ccv.value = &value[1];
ccv.complex_value = &cv;
ccv.zero = 1;
ccv.conf_prefix = 1;
if (ngx_http_compile_complex_value(&ccv) != NGX_OK) {
    return NGX_CONF_ERROR;
}
```

------

在这里,ccv保存初始化复杂值所需的所有参数cv:

·cf:配置指针。

·value:要解析的字符串(输入)。

·complex_value:编译值(输出)。

·zero:启用0终止值的标志。

·conf_prefix:根据配置前缀(Nginx当前查找配置的目录)查找。

·root_prefix:根据Nginx安装路径的根前缀(正常的Nginx安装前缀)查找。

当结果传递给需要以0结尾字符串的库时,0标志很有用,并且在处理文件名时前缀很方便。编译成功后,cv.lengths包含有关表达式中变量是否存在的信息。NULL值表示表达式仅包含静态文本,因此可以存储在简单的字符串中而不是复杂的值中。

ngx_http_set_complex_value_slot()是一个方便的函数,用于在指令声明本身中完全初始化复杂值。在运行时,可以使用ngx_http_complex_value()函数计算复杂值。

------

```
static ngx_int_t
ngx_http_limit_conn_handler(ngx_http_request_t *r)
{
    size_t                          n;
    uint32_t                        hash;
    ngx_str_t                       key;
    ngx_uint_t                      i;
    ngx_slab_pool_t                shpool;     /* 
    ngx_rbtree_node_t              *node;      *
    ngx_pool_cleanup_t             *cln;        *
    ngx_http_limit_conn_ctx_t      *ctx;          *
    ngx_http_limit_conn_node_t     *lc;           * 定义数据类型
    ngx_http_limit_conn_conf_t     *lccf;          *
    ngx_http_limit_conn_limit_t    *limits;          *
    ngx_http_limit_conn_cleanup_t  *lccln;          */
    if (r->main->limit_conn_set) {
        return NGX_DECLINED;
    }
    lccf = ngx_http_get_module_loc_conf(r, ngx_http_limit_conn_module);
    limits = lccf->limits.elts;
    for (i = 0; i < lccf->limits.nelts; i++) {
        ctx = limits[i].shm_zone->data;
        if (ngx_http_complex_value(r, &ctx->key, &key) != NGX_OK) {
                                                                               /*计算复杂变量 */
            return NGX_HTTP_INTERNAL_SERVER_ERROR;
        }
```

------





## 10.15 负载均衡

ngx_http_upstream_module将请求传递到远程的server。要实现特定协议的模块(如HTTP或FastCGI)可使用ngx_http_upstream_module。ngx_http_upstream_module模块还提供了一个用于创建自定义负载均衡(load balancing)模块的接口,并实现了默认的循环方法。least_conn和hash模块实现了替代负载均衡的方法。启用负载均衡方法的示例如下:

------

```
……
http {
  ……
     upstream lbtomcat {  #按权重分发,超时为3秒,失败1次,不再分发
        server 192.168.18.23:80 weight=1 max_fails=1 fail_timeout=3s;
        server 192.168.18.134:80 weight=2max_fails=1 fail_timeout=3s;
    } 
server {
                listen       80;
                server_name  localhost;
                   location / {
                        proxy_http_version 1.1; #http1.1
                        proxy_set_header Upgrade $http_upgrade; #设置标头信息
                        proxy_set_header Connection $connection_upgrade;
                        proxy_set_header   Host    $host;
                        proxy_set_header   X-Real-IP $server_addr;
                        proxy_set_header   REMOTE-HOST $remote_addr; 
                        proxy_set_header   X-Forwarded-For $proxy_add_x_
forwarded_for;
                        proxy_pass http://lbtomcat;
}
```

------

可以通过将相应的上游块放入配置文件中来显式配置ngx_http_upstream_module,或者通过使用诸如proxy_pass之类的指令隐式地配置ngx_http_upstream_module。

upstream指令接收在某个时刻被评估到server列表中的URL。备用负载均衡方法仅适用于显式上游配置。上游模块配置具有其自己的指令上下文NGX_HTTP_UPS_CONF。结构定义如下:

------

```
struct ngx_http_upstream_srv_conf_s {
    ngx_http_upstream_peer_t         peer;
    void                           **srv_conf;
    ngx_array_t                     *servers;  /* ngx_http_upstream_server_t */
    ngx_uint_t                       flags;
    ngx_str_t                        host;
    u_char                          *file_name;
    ngx_uint_t                       line;
    in_port_t                        port;
    ngx_uint_t                       no_port;  /* unsigned no_port:1 */
#if (NGX_HTTP_UPSTREAM_ZONE)
    ngx_shm_zone_t                  *shm_zone;
#endif
};
```

------

其中:

·srv_conf:上游模块的配置上下文。

·servers:用来保存一组server地址的数组,用于负载均衡使用。

·flags:主要标记负载均衡方法支持哪些功能的标志。这些功能配置为server指令的参数如下:

·NGX_HTTP_UPSTREAM_CREATE:区分明确定义的上游与proxy_
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值