Nginx 权威解读

最新推荐文章于 2023-10-17 13:26:30 发布

袁晓俊

最新推荐文章于 2023-10-17 13:26:30 发布

阅读量665

点赞数

分类专栏： Server 文章标签： nginx

Server 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

说明
是一款轻量级的Web服务器/反向代理服务器以及电子邮件代理服务器，并在一个国大型的入口网站及搜索引擎Rambler使用。其特点是占有内存少，并发能力强，事实上nginx的并发能力确实在同类型的网页服务器中表现较好。
Nginx相较于Apache\lighttpd具有占有内存少，稳定性高等优势，并且依靠并发能力强，丰富的模块库以及友好灵活的配置而闻名。在Linux操作系统下，nginx使用epoll事件模型,得益于此，nginx在Linux操作系统下效率相当高。同时Nginx在OpenBSD或FreeBSD操作系统上采用类似于Epoll的高效事件模型kqueue

代理和反向代理

代理服务器
一般是指局域网内部的机器通过代理服务器发送请求到互联网上的服务器，代理服务器一般作用在客户端。

反向代理
客户端（用户A）向反向代理的命名空间（name-space）中的内容发送普通请求，接着反向代理将判断向何处（原始服务器）转交请求，并将获得的内容返回给客户端。而客户端始终任务它访问的是原始服务器B而不是服务器Z。由于防火墙作用，只允许服务器Z进出，防火墙和反向代理共同作用保护了院子资源服务器B。

用途
用途：将防火墙后面的服务器提供给Internet用户访问。反向代理还可以为后端的多台服务器提供负载平衡或为后端较慢的服务器提供缓冲服务。
正向代理
正向代理
正向代理是一个位于客户端A和原始服务器（服务器B）之间的服务器（代理服务器Z），为了从原始服务器取得内容，用户A向代理服务器Z发送一个请求并指定目标（服务器B），然后代理服务器Z向服务器B转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
“`

用途和安全性
1>用途：
在防火墙内的局域网客户端提供访问Internet的途径。
还可以使用缓冲特性减少网络使用率。
2>从安全性来讲：
正向代理允许客户端通过它访问任意网站并且隐藏客户端自身，因此你必须采取
安全措施以确保仅为经过授权的客户端提供服务。
反向代理对外都是透明的，访问者并不知道自己访问的是一个代理。

三、Nginx VSApache

相同点：
1、都是HTTP服务器软件
2、功能上都采用模块化结构设计
3、都支持通用的语言接口，如PHP、Perl、Python等
4、支持正向、反向代理、虚拟主机、URL重写、压缩传输、SSL加密传输

不同点：
1、Apache处理速度很慢，占用很多内存资源
2、功能上，Apache所有模块支持动静态编译，Nginx模块都是静态编译的
3、对Fcgi的支持：Apache支持的很不好，Nginx支持非常好
4、处理连接方式：Nginx支持epoll,Apache不支持
5、空间使用上：Nginx安装包仅几百K

四、Nginx优势

1、作为Web服务器，Nginx处理静态文件、索引文件，自动索引的效率非常高

2、作为代理服务器，Nginx可以实现无缓存的反向代理加速，提高网站运行速度

3、作为负载均衡服务器，Nginx既可以在内部直接支持Rails和PHP，也可以支持HTTP代理服务器对外进行服务，同时还支持简单的容错和利用算法进行负载均衡

4、在性能方面，Nginx是专门为性能优化而开发的，实现上非常注重效率。它采用内核Poll模型，可以支持更多的并发连接，最大可以支持对5万个并发连接数的响应，而且只占用很低的内存资源

5、在稳定性方面，Nginx采取了分阶段资源分配技术，使得CPU与内存的占用率非常低。Nginx官方表示，Nginx保持1万个没有活动的连接，而这些连接只占用2.5MB内存，因此，类似DOS这样的攻击对Nginx来说基本上是没有任何作用的

6、在高可用性方面，Nginx支持热部署，启动速度特别迅速，因此可以在不间断服务的情况下，对软件版本或者配置进行升级，即使运行数月也无需重新启动，几乎可以做到7x24小时不间断地运行 Nginx具有很高的稳定性；支持热部署；代码质量非常高，代码很规范，手法成熟，模块扩展也很容易；采用了一些os提供的最新特性如对sendfile(Linux2.2+),accept-filter（FreeBSD4.1+）,TCP_DEFER_ACCEPT(Linux 2.4+)的支持，从而大大提高了性能。
模块化
高度模块化的设计设Nginx架构的基础。在Nginx中，除了少量的核心代码，其他一切皆为模块。模块化设计具有以下特点：
1、高度抽象的模块接口
2、灵活性
3、配置模块的设计使Nginx提供了高可配置性、高可扩展性、高可定制性、高可伸缩性。
4、核心模块接口简单化
5、多层次、多类别的模块设计
所有模块间是分层次、分类别的，官方Nginx有五大类型的模块：核心模块、配置模块、事件模块、HTTP模块、mail模块。
配置模块和核心模块这两种模块类型是由Nginx的框架代码所定义的，这里的配置模块是所有模块的基础，它实现了最基本的配置项解析功能（解析nginx.conf文件）。Nginx框架还会调用核心模块，但其他三种模块都不会与框架产生直接关系。事件模块、HTTP模块、mail模块这三种模块的共性是：实际上它们在核心模块中各有1个模块作为自己的代言人，并在同类模块中有1个作为核心业务与管理功能的模块。
模块化

说明：Nginx模块直接被编译仅Nginx,因此属于静态编译方式。启动Nginx后，Nginx的模块被自动加载，不像Apache，首先将模块编译为一个so文件，然后再配置文件汇总指定是否进行加载。在解析配置文件时，Nginx的每一个模块都有可能去处理某个请求，但是同一个处理请求只能由一个模块来完成。
进程管理、多工作模式

Nginx由一个master进程和多个worker进程组成，但master进程或者worker进程中并不会再创建线程。

yxj
一、master进程和worker进程的作用
master进程
不需要处理网络事件，不负责业务的执行，只会通过管理worker等子进程来实现重启服务、平滑升级、更换日志文件、配置文件实时生效等功能。
master是通过fork系统调用子进程来实现和子进程的通信。
worker进程用来处理master进程fork过来的请求worker进程是通过处理信号来实现和master通信的
二、信号的处理过程
Master进程接收到信号是怎样进行处理的？
进程接收到信号后，会先重新加载配置文件，然后再启动新的进程，并向所有老的进程发送信号，告诉他们可以光荣退休了。新的进程在启动后，就开始接受新的请求，而老的进程在收到来自master信号后，就不再接收新的请求，并且在当前进程中的所有未处理完的请求处理完成后再退出。
Worker进程接收到信号是怎样进行处理的？
首先，worker进程之间是平等的，每个进程，处理请求的机会也是一样的。当我们提供80端口的http服务时，一个连接请求过来，每个进程都有可能处理这个连接，怎么做到的呢？首先，每个worker进程都是从master进程fork过来的，在master进程里面，先建立好需要listen的socket之后，然后再fork出多个worker进程，这样每个worker进程都可以去接受这个socket。一般来说，当一个连接进来后，所有在accept这个socket上面的进程都会收到通知，而只有一个进程可以接受这个连接，其他的则accept失败，这就是所谓的惊群现象。
那么为了解决这个问题，Nginx提供了一个accept_mutex（可选项，默认打开）。这是一个加在accept上的一把共享所。有了这把锁之后，同一时刻，就会只有一个进程在accept连接,这样就不会有惊群问题了。
当一个worker进程在accept这个连接之后，就开始读取请求，解析请求，处理请求，产生数据后，再返回给客户端，最后才断开连接。一个请求，完全由worker进程来处理，而且只在一个worker进程中处理。
三、这样设计的优点
1、利用多核系统的并发处理能力
现在操作系统都是多核CPU，如果一直是只有一个进程在工作，那么浪费资源，如果是worker进程间地位不平等势必造成进程瓶颈问题，Nginx为了避免这个问题，设计worker间进程平等。另外，worker数与cpu核数一致，则会达到CPU资源的充分利用，如果worker数多于cpu核数，势必造成资源的竞争；若小于cpu核数，势必造成资源浪费。提高网络性能，降低请求时延。
2、负载均衡
多个worker之间通过进程通信来实现负载均衡。即当一个请求到来时，更容易分配到负载较轻的worker进程中处理。这将降低请求的时延，并在一定程度上提高网络性能
3、管理进程负责监控工作进程的状态，并负责管理其行为
这样做的好处是：
a.管理进程不会占用多少系统资源
b.管理进程负责监控工作进程状态，如果某个工作进程死掉，管理进程负
责创建出新的工作进程，避免系统性能下降。提高了系统的可靠性。
可扩展性、动态定制性、动态进化性较容易实现。

工作原理
上篇文章介绍了Nginx框架的设计之管理进程以及多个工作进程的设计，master进程用来管理通过fork子进程与子进程通信，子进程通过处理进程信号接到master的通信去处理请求。
Nginx工作原理：
Nginx会按需同时运行多个进程：一个主进程和几个工作进程，配置了缓存时还会有缓存加载器进程（cache loader）和缓存管理器进程（cache manager)等。所有进程均是仅含有一个线程，并主要通过“共享内存”的机制实现进程间通信。主进程以root用户身份运行，而worker、cache loader和cache manager均应以非特权用户身份运行。

一、Nginx模块常规的HTTP请求和响应的过程：
这里写图片描述

当它接收到一个HTTP请求时，它仅仅是通过查找配置文件将此次请求映射到一个location block,而此location中配置的各个指令则会启动不同的模块去完成工作，因此模块可以看做Nginx真正的劳动工作者。通常一个location中的指令会涉及一个handler模块和多个filter模块（当然，多个location可以服用同一个模块）。handler模块负责处理请求，完成响应内容的生成，而filter模块对响应内容进行处理。

二、Nginx作为Http反向代理服务器的用法：

Nginx具有“强悍”的高并发高负载能力，因此一般会作为前段的服务器直接向客户端提供静态文件服务。但也有一些复杂、多变的业务不适合放到Nginx服务器上，这时会用Apache、Tomcat等服务器来处理。于是，Nginx通常会被配置为既是静态Web服务器也是反向代理服务器，不适合Nginx处理的请求就会直接转发到上游服务器中处理。

Nginx作为HTTP服务器以及反向代理服务器：

这里写图片描述

Nginx作为反向代理服务器时转发请求的流程

这里写图片描述

Nginx减轻了上游服务器的并发压力；延长了一个请求的处理时间，并增加了用于缓存请求内容的内存和磁盘空间。

三、总结
Nginx是一个高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/SMTP服务器。工作原理也很简单，通过转发请求，分担压力，从而减轻服务器的压力，达到负载均衡的效果。

* nginx+tomcat实现负载均*
Nginx占有内存少,并发能力强,事实上Nginx的并发能力确实在同类型的网页伺服器中表现较好.目前中国大陆使用Nginx网站用户有:新浪,网易,腾讯等.

本文主要是基于Nginx搭建tomcat集群.
环境:
Win8.1,JDK 1.6 , Nginx1.9.3
Tomcat 7.0.63(两个tomcat服务器
这里写图片描述

一、Nginx之反向代理

1、Nginx配置:

[java] view plaincopyprint?

upstreamlocahost{  
     #ip_hash;  
     server192.168.24.17:8080  weight=1;  
     server192.168.24.43:8080  weight=2;  
}

2、效果:

这里写图片描述

反向代理:对于客户端而言,它就像是演示服务器,并且客户端不需要进行任何特别的设置.客户端反向代理的命名空间中的内容发送普通请求,接着反向代理将判断向何处转交请求,并将获得的内容返回给客户端,就像这些内容原本就是它自己的一样

二、Nginx之负载均衡

1、实例
a.Nginx配置

[java] view plaincopyprint?

upstream192.168.24.17{  
      #ip_hash;  
     server192.168.24.17:8080  weight=1;  
     server192.168.24.43:8080  weight=2;  
}  
    #gzip on;  
    server {  
        listen       8888;  
        server_name  192.168.24.17;  
       #charset koi8-r;  
        #access_log  logs/host.access.log  main; 
        location / {  
   root   html;  
          index  index.html index.htm;  
  proxy_pass  http://192.168.24.17;  

proxy_connect_timeout1;  
proxy_send_timeout30;  
proxy_read_timeout60;  
       }  
        error_page   500 502 503 504  /50x.html;  
       location = /50x.html {  
            root   html;  
       }

b.配置说明:
a.Weight:权重,值越大,命中率越高
b.上面标红的地方:192.168.24.17,这三处要一致才能实现负载均衡的效果.
c.实验效果:
这里写图片描述

说明:这个IP以及端口号是nginx设置的名称以及端口号.访问后能分别调用到后端不同的服务器.实现负载均衡效果.进一步可以看出本实例使用的是轮询的方式,也就是负载均衡默认的方式.

2.原理

1).upstream负载均衡模块说明:
upstream是Nginx的HTTP Upstream模块,这个模块通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡.在上面的设定中,听过upstream指令指定了一个负载均衡的名称为192.168.24.17.这个名称可以任意指定,在后面需要用到的地方直接调用即可.

2).updtream支持的负载均衡算法

Nginx的负载均衡模块目前支持4种调度算法.
轮询(默认).每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动提出,使用户访问不受影响.Weight指定轮询权值,Weight值越大,分配到的访问几率越高,用于后端每个服务器性能不均的情况下.
ip_hash 每个请求按访问IP的hash结果分配,这样来自同一个IP的访客固定访问一个后端服务器,有效解决了动态网页存在的session共享问题.
fair这是比上面两个更加智能的负载均衡算法.这种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配.Nginx本身是不支持fair的,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块.
url_hash此方法按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率.Nginx本身是不支持url_hash的,如果需要使用这种调度算法,必须安装Nginx的hash软件包.

3).upstream支持的状态参数

在HTTP Upstream模块汇总,可以通过server指令指定后端服务器的IP地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态.常用的状态有:
down,表示当前的server暂时不参与负载均衡.
backup,预留的备份机器.当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这才记起的眼里最轻.
max_fails,允许请求失败的次数,默认为1.当超过最大次数时,返回proxy_next_upstream模块定义的错误.
fail_timeout,在经历了max_fails次失败后,暂停服务时间.max_fails可以和fail_timeout一起使用.

注:当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能使weight和backup.
通过这种方式,当我们的网站访问量越来越大时,我们就能承受更多的压力,并且能够动态的添加服务器.配置负载均衡很简单,那么如何实现多台服务器之间session的共享呢?下篇继续介绍.

注意:nginx放到中文目录下,启动时会有问题.

打印出来的日志:
[emerg] 10744#10916: CreateFile()”E:\02 Java内容学习汇总\Nginx\nginx-1.4.7/conf/nginx.conf”failed (1113: No mapping for the Unicode character exists in the targetmulti-byte code page)

袁晓俊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Nginx 权威解读

说明是一款轻量级的Web服务器/反向代理服务器以及电子邮件代理服务器，并在一个国大型的入口网站及搜索引擎Rambler使用。其特点是占有内存少，并发能力强，事实上nginx的并发能力确实在同类型的网页服务器中表现较好。 Nginx相较于Apache\lighttpd具有占有内存少，稳定性高等优势，并且依靠并发能力强，丰富的模块库以及友好灵活的配置而闻名。在Linux操作系统下，ngin
复制链接

扫一扫

专栏目录