Nginx(一)nginx基础和nginx的配置

1. Nginx的特点

(1) 更快
这表现在两个方面: 一方面, 在正常情况下, 单次请求会得到更快的响应; 另一方面,在高峰期(如有数以万计的并发请求) , Nginx可以比其他Web服务器更快地响应请求。
(2) 高扩展性
Nginx的设计极具扩展性, 它完全是由多个不同功能、 不同层次、 不同类型且耦合度极低的模块组成。 因此, 当对某一个模块修复Bug或进行升级时, 可以专注于模块自身, 无须在意其他。 而且在HTTP模块中, 还设计了HTTP过滤器模块: 一个正常的HTTP模块在处理完请求后, 会有一串HTTP过滤器模块对请求的结果进行再处理。 这样, 当我们开发一个新的HTTP模块时, 不但可以使用诸如HTTP核心模块、 events模块、 log模块等不同层次或者不同类型的模块, 还可以原封不动地复用大量已有的HTTP过滤器模块。 这种低耦合度的优秀设计, 造就了Nginx庞大的第三方模块, 当然, 公开的第三方模块也如官方发布的模块一样
容易使用。
Nginx的模块都是嵌入到二进制文件中执行的, 无论官方发布的模块还是第三方模块都是如此。 这使得第三方模块一样具备极其优秀的性能, 充分利用Nginx的高并发特性, 因此, 许多高流量的网站都倾向于开发符合自己业务特性的定制模块。
(3) 高可靠性
高可靠性是我们选择Nginx的最基本条件, 因为Nginx的可靠性是大家有目共睹的, 很多家高流量网站都在核心服务器上大规模使用Nginx。 Nginx的高可靠性来自于其核心框架代码的优秀设计、 模块设计的简单性; 另外, 官方提供的常用模块都非常稳定, 每个worker进程相对独立, master进程在1个worker进程出错时可以快速“拉起”新的worker子进程提供服务。
(4) 低内存消耗
一般情况下, 10000个非活跃的HTTP Keep-Alive连接在Nginx中仅消耗2.5MB的内存, 这是Nginx支持高并发连接的基础。
(5) 单机支持10万以上的并发连接
这是一个非常重要的特性! 随着互联网的迅猛发展和互联网用户数量的成倍增长, 各大公司、 网站都需要应付海量并发请求, 一个能够在峰值期顶住10万以上并发请求的Server,无疑会得到大家的青睐。 理论上, Nginx支持的并发连接上限取决于内存, 10万远未封顶。当然, 能够及时地处理更多的并发请求, 是与业务特点紧密相关的。

(6) 热部署
master管理进程与worker工作进程的分离设计, 使得Nginx能够提供热部署功能, 即可以在7×24小时不间断服务的前提下, 升级Nginx的可执行文件。 当然, 它也支持不停止服务就更新配置项、 更换日志文件等功能。
(7) 最自由的BSD许可协议
这是Nginx可以快速发展的强大动力。 BSD许可协议不只是允许用户免费使用Nginx, 它还允许用户在自己的项目中直接使用或修改Nginx源码, 然后发布。 这吸引了无数开发者继续为Nginx贡献自己的智慧。

2. Linux系统

首先我们需要一个内核为Linux 2.6及以上版本的操作系统, 因为Linux 2.6及以上内核才支持epoll, 而在Linux上使用select或poll来解决事件的多路复用, 是无法解决高并发压力问题的。
我们可以使用uname-a命令来查询Linux内核版本, 例如:

[root@localhost ~]# uname -a
Linux localhost.localdomain 3.10.0-862.14.4.el7.x86_64 #1 SMP Wed Sep 26 15:12:11 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

3. 使用Nginx必备的软件

(1) GCC编译器
GCC(GNU Compiler Collection) 可用来编译C语言程序。 Nginx不会直接提供二进制可执行程序(1.2.x版本中已经开始提供某些操作系统上的二进制安装包了, 不过, 本书探讨如何开发Nginx模块是必须通过直接编译源代码进行的) , 这有许多原因, 本章后面会详述。
我们可以使用最简单的yum方式安装GCC, 例如:

yum -y install gcc

GCC是必需的编译工具。 在第3章会提到如何使用C++来编写Nginx HTTP模块, 这时就需要用到G++编译器了。 G++编译器也可以用yum安装, 例如:

yum -y install gcc-c++

(2) PCRE库
PCRE(Perl Compatible Regular Expressions, Perl兼容正则表达式) 是由Philip Hazel开发的函数库, 目前为很多软件所使用, 该库支持正则表达式。 它由RegEx演化而来, 实际上,Perl正则表达式也是源自于Henry Spencer写的RegEx。
如果我们在配置文件nginx.conf里使用了正则表达式, 那么在编译Nginx时就必须把PCRE库编译进Nginx, 因为Nginx的HTTP模块要靠它来解析正则表达式。 当然, 如果你确认不会使用正则表达式, 就不必安装它。 其yum安装方式如下:

yum -y install pcre pcre-devel

pcre-devel是使用PCRE做二次开发时所需要的开发库, 包括头文件等, 这也是编译Nginx所必须使用的。
(3) zlib库
zlib库用于对HTTP包的内容做gzip格式的压缩, 如果我们在nginx.conf里配置了gzip on,并指定对于某些类型(content-type) 的HTTP响应使用gzip来进行压缩以减少网络传输量, 那么, 在编译时就必须把zlib编译进Nginx。 其yum安装方式如下:

yum -y install zlib zlib-devel

(4) OpenSSL开发库
如果我们的服务器不只是要支持HTTP, 还需要在更安全的SSL协议上传输HTTP, 那么就需要拥有OpenSSL了。 另外, 如果我们想使用MD5、 SHA1等散列函数, 那么也需要安装它。 其yum安装方式如下:

yum -y install openssl openssl-devel

4. 磁盘目录

(1) Nginx源代码存放目录
该目录用于放置从官网上下载的Nginx源码文件, 以及第三方或我们自己所写的模块源代码文件。

(2) Nginx编译阶段产生的中间文件存放目录
该目录用于放置在configure命令执行后所生成的源文件及目录, 以及make命令执行后生成的目标文件和最终连接成功的二进制文件。 默认情况下, configure命令会将该目录命名为objs, 并放在Nginx源代码目录下。
(3) 部署目录
该目录存放实际Nginx服务运行期间所需要的二进制文件、 配置文件等。 默认情况下,该目录为/usr/local/nginx。

(4) 日志文件存放目录
日志文件通常会比较大, 当研究Nginx的底层架构时, 需要打开debug级别的日志, 这个级别的日志非常详细, 会导致日志文件的大小增长得极快, 需要预先分配一个拥有更大磁盘空间的目录。
5. Linux内核参数的优化

由于默认的Linux内核参数考虑的是最通用的场景, 这明显不符合用于支持高并发访问的Web服务器的定义, 所以需要修改Linux内核参数, 使得Nginx可以拥有更高的性能。
在优化内核时, 可以做的事情很多, 不过, 我们通常会根据业务特点来进行调整, 当Nginx作为静态Web内容服务器、 反向代理服务器或是提供图片缩略图功能(实时压缩图片)的服务器时, 其内核参数的调整都是不同的。 这里只针对最通用的、 使Nginx支持更多并发请求的TCP网络参数做简单说明。
首先, 需要修改/etc/sysctl.conf来更改内核参数。 例如, 最常用的配置:

fs.file-max = 999999
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_keepalive_time = 600

net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_max_tw_buckets = 5000
net.ipv4.ip_local_port_range = 1024 61000
net.ipv4.tcp_rmem = 4096 32768 262142
net.ipv4.tcp_wmem = 4096 32768 262142
net.core.netdev_max_backlog = 8096
net.core.rmem_default = 262144
net.core.wmem_default = 262144
net.core.rmem_max = 2097152
net.core.wmem_max = 2097152
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_max_syn.backlog=1024

执行sysctl-p 命令,使上述生效。

上面的参数意义解释如下:
·file-max: 这个参数表示进程(比如一个worker进程) 可以同时打开的最大句柄数, 这个参数直接限制最大并发连接数, 需根据实际情况配置。
·tcp_tw_reuse: 这个参数设置为1, 表示允许将TIME-WAIT状态的socket重新用于新的TCP连接, 这对于服务器来说很有意义, 因为服务器上总会有大量TIME-WAIT状态的连接。
·tcp_keepalive_time: 这个参数表示当keepalive启用时, TCP发送keepalive消息的频度。默认是2小时, 若将其设置得小一些, 可以更快地清理无效的连接。
·tcp_fin_timeout: 这个参数表示当服务器主动关闭连接时, socket保持在FIN-WAIT-2状态的最大时间。
·tcp_max_tw_buckets: 这个参数表示操作系统允许TIME_WAIT套接字数量的最大值,如果超过这个数字, TIME_WAIT套接字将立刻被清除并打印警告信息。 该参数默认为180000, 过多的TIME_WAIT套接字会使Web服务器变慢。
·tcp_max_syn_backlog: 这个参数表示TCP三次握手建立阶段接收SYN请求队列的最大长度, 默认为1024, 将其设置得大一些可以使出现Nginx繁忙来不及accept新连接的情况时,Linux不至于丢失客户端发起的连接请求。
·ip_local_port_range: 这个参数定义了在UDP和TCP连接中本地(不包括连接的远端)端口的取值范围。
·net.ipv4.tcp_rmem: 这个参数定义了TCP接收缓存(用于TCP接收滑动窗口) 的最小值、 默认值、 最大值。
·net.ipv4.tcp_wmem: 这个参数定义了TCP发送缓存(用于TCP发送滑动窗口) 的最小值、 默认值、 最大值。
·netdev_max_backlog: 当网卡接收数据包的速度大于内核处理的速度时, 会有一个队列保存这些数据包。 这个参数表示该队列的最大值。
·rmem_default: 这个参数表示内核套接字接收缓存区默认的大小。
注意 :滑动窗口的大小与套接字缓存区会在一定程度上影响并发连接的数目。 每个TCP连接都会为维护TCP滑动窗口而消耗内存, 这个窗口会根据服务器的处理速度收缩或扩张。

参数wmem_max的设置, 需要平衡物理内存的总大小、 Nginx并发处理的最大连接数量(由nginx.conf中的worker_processes和worker_connections参数决定) 而确定。 当然, 如果仅仅为了提高并发量使服务器不出现Out Of Memory问题而去降低滑动窗口大小, 那么并不合适, 因为滑动窗口过小会影响大数据量的传输速度。 rmem_default、 wmem_default、rmem_max、 wmem_max这4个参数的设置需要根据我们的业务特性以及实际的硬件成本来综合考虑。
·tcp_syncookies: 该参数与性能无关, 用于解决TCP的SYN攻击。
 

6. 获取Nginx源码

可以在Nginx官方网站(http://nginx.org/en/download.html ) 获取Nginx源码包。 将下载的nginx-1.0.14.tar.gz源码压缩包放置到准备好的Nginx源代码目录中, 然后解压。 例如:
最新稳定版本为1.14.0

wget http://nginx.org/download/nginx-1.14.0.tar.gz
tar -zxvf nginx-1.14.0.tar.gz

7. 编译安装

cd nginx-1.14.0
./configure
make
make install

configure命令做了大量的“幕后”工作, 包括检测操作系统内核和已经安装的软件, 参数的解析, 中间目录的生成以及根据各种参数生成一些C源码文件、 Makefile文件等。
make命令根据configure命令生成的Makefile文件编译Nginx工程, 并生成目标文件、 最终的二进制文件。
make install命令根据configure执行时的参数将Nginx部署到指定的安装目录, 包括相关目录的建立和二进制文件、 配置文件的复制。
 

8. Configure详解

可以看出, configure命令至关重要, 下文将详细介绍如何使用configure命令, 并分析configure到底是如何工作的, 从中我们也可以看出Nginx的一些设计思想。
 

configure 的命令参数

./configure --help


(1) 路径相关的参数

列出了Nginx在编译期、 运行期中与路径相关的各种参数。
 

configure支持的路径相关参数
参数名称意义默认值
--prefix=PATHNginx 安装部署后的根目录

默认为/usr/local/nginx目录。注意:这个目录的设置会影响其他参数中的相对目录。例如,如果设置了 --sbin-path=sbin/nginx, 那么实际上可执行文件会被放到/usr/local/nginx/sbin/nginx中

 

--sbin-path=PATH可执行文件的放置路径<prefix>/sbin/nginx
--conf-path=PATH配置文件的放置路径<prefix>/conf/nginx.conf
--error-log-path=PATH错误日志的放置路径。error日志用于定位问题,可输出多种级别(包括debug调试级别)的日志。它的配置非常灵活,可以再nginx.conf里配置为不同请求的日志并输出到不同的log文件中。这里默认的Nginx核心日志路径。<prefix>/logs/error.log
--pid-path=PATHpid文件的存放路径。这个文件里仅以ASC Ⅱ码存放着Nginx master的进程ID,有了这个进程ID,在使用命令行(例如nginx -s reload)通过读取master进程ID向master进程发送信号时,才能对运行中的Nginx服务产生作用<prefix>/logs/nginx.pid
--lock-path=PATHlock文件的放置路径<prefix>/logs/nginx.lock
--builddir=DIRconfigure执行时与编译期间产生的临时文件放置目录,包括产生的Makefile、C源文件、目标文件、可执行文件等<nginx source path>/objs
--with-perl_modules_path=PATHperl module放置的路径。只有使用第三方的perl module, 才需要配置这个路径
--with-perl=PATHperl binary 放置的路径。如果配置的Nginx会执行Perl脚本,那么久必须要设置此路径
--http-log-path=PATHaccess日志放置的位置。每一个HTTP请求在结束时都会记录的访问日志<prefix>/logs/access.log
--http-client-body-temp-path=PATH处理HTTP请求时如果请求的包括需要暂时存放到临时磁盘文件中,则把这样的临时文件放置到该路径下

<prefix>/client_body_temp

--http-proxy-temp-path=PATHNginx作为HTTP反向代理服务器时,上游服务器产生的HTTP包体在需要临时存放到磁盘文件时,这样的临时文件将放到该路径下<prefix>/proxy_temp
--http-fastcgi-temp-path=PATHFastcgi所使用临时文件的放置目录

<prefix>/fastcgi_temp

--http-uwsgi-temp-path=PATHuWSGI所使用临时文件的放置目录<prefix>/uwsgi_temp
--htpp-scgi-temp-path=PATHSCGI所使用临时文件的放置目录<prefix>/scgi_temp

(2) 编译相关的参数

Configure支持的编译相关参数
编译参数意义
--with-cc=PATHC编译器的路径
--with-cpp=PATHC与编译器的路径
--with-cc-opt=OPTIONS如果希望在Nginx编译期间指定加入一些编译选项,如知道宏或者使用-Ⅰ加入某些需要包含的目录,这时可以使用该参数达成目的
--with-ld-opt=OPTIONS最终的二进制可执行文件是由编译后生成的目标文件与一些第三方库链接生成的,在执行链接操作时可能会需要指定链接参数,--with-ld-opt就是用于加入链接时的参数。例如,如果我们希望将某个库链接到Nginx程序中,需要在这里加入--with-ld-opt=llibraryName -LlibraryPath, 其中libraryName是目标库的名称,libraryPath则是目标库所在的路径
--with-cpu-opt=CPU指定CUP处理器架构,只能从以下取值中选择:pentium、pentiumpro、pentium3、pentium4、athlon、opteron、sparc32、sparc64、ppc64

(3) 依赖软件的相关参数

PCRE的参数设置
PCRE库的参数设置意义
--without-pcre如果确认Nginx不用解析正则表达式,也就是说,nginx.conf配置文件中不会出现正则表达式,那么可以使用这个参数
--with-pcre强制使用PCRE库
--with-pcre=DIR指定PCRE库的源码设置,在编译Nginx时会进入该目录编译PCRE源码
--with-pcre-opt=OPTIONS编译PCRE源码时希望加入的编译选项
OpenSSL的参数设置
OpenSSL的参数设置意义
--with-openssl=DIR

指定OpenSSL库的源码位置,在编译Nginx时会进入该目录编译OpenSSL源码

注意:如果Web服务器支持HTTPS, 也就是SSL协议,Nginx要求必须使用OpenSSL。可以访问http://www.openssl.org/免费下载

--with-openssl-opt=OPTIONS编译openssl源码时希望加入的编译选项

(4)原子库的设置参数

原子库的设置参数
atomic库的设置参数意义
--with-libatomic强制使用atomic库。atomic库是CPU架构独立的一种原子操作实现。它支持以下体系架构:x86(包括i386和x86_64、PPC64、Spare64(v9或更高版本)或者安装了GCC4.1.0及更高版本的架构。
--with-libatomic=DIRatomic库所在的位置

 

 (5) 散列函数库的参数设置

散列函数库的参数设置
散列函数库的参数设置意义
--with-MD5=DIR

指定MD5库的源码位置,在编译Nginx时会进入该目录编译MD5源码

注意:Nginx源码中已经有了MD5算法的实现,如果没有特殊需求,那么完全可以使用Nginx自身实现的MD5算法

--with-MD5-opt=OPTIONS编译MD5源码时希望加入的编译选项
--with-MD5-asm使用MD5的汇编选项
--with-SHA1=DIR

指SHA1库的源码位置,在编译Nginx时会进入该目录编译SHA1源码

注意:OpenSSL中已经有了SHAI算法的实现。如果已经安装了OpenSSL,那么完全可以OpenSSL实现的算法

--with-SHA1-opt=OPTIONS编译SHA1源码时希望加入的编译选项
--with-SHA1=asm使用SHA1的汇编源码

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值