Nginx 反向代理使用配置说明

Nginx 反向代理使用配置说明

一、反向代理 - 原理nginx-原理

%E5%8E%9F%E7%90%86.jpg&pos_id=img-RKqgUQ3Q-1721350065996)

  1. 由于Nginx监听了192.168.12.129的80端口,所以最终该请求会找到Nginx进程;
  2. Nginx首先会根据配置的location规则进行匹配,根据客户端的请求路径/,会定位到location /{}规则;
  3. 然后根据该location中配置的proxy_pass会再找到名为nginx_boot的upstream;
  4. 最后根据upstream中的配置信息,将请求转发到运行WEB服务的机器处理,由于配置了多个WEB服务,且配置了权重值,因此Nginx会依次根据权重比分发请求。

二、代理 - http 协议

http {
  underscores_in_headers on;
  client_max_body_size 1000m;
  include       mime.types;
  default_type  application/octet-stream;
  server {
    listen 2227;
    server_name  localhost;
    location / {
      proxy_set_header X-Real-IP $http_x_forwarded_for;
      proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
      proxy_pass http://113.106.120.242:9001;
    }
  }
  include conf/nginx.80.conf;
}
常用参数说明
配置项模块参数值说明默认值
underscores_in_headershttpon/off请求头包含下划线off
client_max_body_sizehttp示例:1000m上传文件大小限制

三、代理 - Stream 协议

stream {
  server {
    listen 2226;
    proxy_connect_timeout 30s;
    proxy_timeout 60s;
    proxy_pass 192.168.1.252:3306;
  }
}

四、location 服务代理

  1. 转发 proxy_pass
location /proxyPath/ {
	proxy_pass http://172.16.10.96/path/;
}

ip:port/proxyPath/callPath -> http://172.16.10.96/path/callPath
此处要注意 http://172.16.10.96/path/callPath 下的相对路径转发
相对路径重定向:
今天在做nginx反向代理apache的时候出了一点点问题,原来后端apache用的端口是8080通过反向代理后,
使用wireshark抓包发现location头域数值为http://192.168.1.154:8080/wuman/ 如果把这个返回给客户端肯定是不可以的,
看起来别扭而且还暴露了apache的具体信息
所以在这里用到了nginx的proxy_redirect指定修改被代理服务器返回的响应头中的location头域跟refresh头域数值

  • 常用参数说明
参数名称说明参数值默认值
proxy_redirect在 http,server,location 模块下使用default,off,redirect,replacementdefault
如果需要修改从被代理服务器传来的应答头中的"Location"和"Refresh"字段,可以用这个指令设置。利用这个指令可以为被代理服务器发出的相对重定向增加主机名;
在指令中可以使用一些变量:
proxy_redirect http://localhost:8000/ http:// h o s t : host: host:server_port/;
这个指令有时可以定义多个:
proxy_redirect default;
proxy_redirect http://localhost:8000/ /;
proxy_redirect ; /;
参数off将在这个字段中禁止所有的proxy_redirect指令:
proxy_redirect off;

假设被代理服务器返回Location字段为: http://localhost:8000/two/some/uri/
这个指令:
proxy_redirect http://localhost:8000/two/ http://frontend/one/;
将Location字段重写为http://frontend/one/some/uri/。
在代替的内容中可以不写服务器名:
proxy_redirect http://localhost:8000/two/ /;
这样就使用服务器的基本名称和端口,即使它来自非80端口。
如果使用“default”参数,将根据location和proxy_pass参数的设置来决定。
例如下列两个配置等效:
样例说明:

server {
  listen       80;
  server_name  www.boke.com;
  location / {
    proxy_pass http://192.168.1.154:8080;
    proxy_redirect off;
  }
}

此时我们通过curl查看结果得出:

[root@localhost nginx]# curl -I http://www.boke.com/wuman
HTTP/1.1 301 Moved Permanently
Server: nginx
Date: Thu, 24 Dec 2015 12:02:00 GMT
Content-Type: text/html; charset=iso-8859-1
Connection: keep-alive
Location: http://192.168.1.154:8080/wuman/

这里location为带有后端服务器实际地址跟端口的响应头信息这样在实际线上是不允许的所以这里我们打算通过proxy_redirect将被代理服务器的响应头中的location字段进行修改后返回给客户端

server {
  listen       80;
  server_name  www.boke.com;
  location / {
    proxy_pass http://192.168.1.154:8080;
    proxy_redirect http://192.168.1.154:8080/wuman/  http://www.boke.com/wuman/;
  }
}
server {
  listen       80;
  server_name  www.boke.com;
  location / {
    proxy_pass http://192.168.1.154:8080;
    proxy_redirect ~^http://192.168.1.154:8080(.*)   http://www.boke.com$1;
  }
}

则curl查看返回结果

[root@localhost nginx]# curl -I http://www.boke.com/wuman
HTTP/1.1 301 Moved Permanently
Server: nginx
Date: Thu, 24 Dec 2015 12:08:34 GMT
Content-Type: text/html; charset=iso-8859-1
Connection: keep-alive
Location: http://www.boke.com/wuman/

此时查看location已经变成了我们想要的结果了。 此时通过replacement 301重定向到了我们新的页面

五、location 静态文件代理

  1. 根目录 root
location /proxyPath {
  root   html; # rootDir
  index  index.html index.htm;
}
访问说明:ip:port/proxyPath/callPath  ->  rootDir/proxyPath/callPath
示例 :
location / {
  root   html; 
  index  index.html index.htm;
}
访问:  ip:port/dists/test.html  ->  html/dists/test.html
  1. 重命名 alias
location /proxyPath {
  alias   html;  # aliasDir
}
访问说明:ip:port/proxyPath/callPath -> aliasDir/callPath

六、负载均衡

upstream nginx_boot{
  # 30s内检查心跳发送两次包,未回复就代表该机器宕机,请求分发权重比为1:2
  server 192.168.0.000:8080 weight=100 max_fails=2 fail_timeout=30s; 
  server 192.168.0.000:8090 weight=200 max_fails=2 fail_timeout=30s;
  # 这里的IP请配置成你WEB服务所在的机器IP
}
server {
  location / {
    xxx ... ...
    proxy_pass http://nginx_boot;
  }
}

七、资源压缩

Nginx也提供了三个支持资源压缩的模块ngx_http_gzip_module、ngx_http_gzip_static_module、ngx_http_gunzip_module;
其中ngx_http_gzip_module属于内置模块,代表着可以直接使用该模块下的一些压缩指令,后续的资源压缩操作都基于该模块,
先来看看压缩配置的一些参数/指令:

参数项释义参数值
gzip开启或关闭压缩机制on/off
gzip_types根据文件类型选择性开启压缩机制image/png、text/css…
gzip_comp_level用于设置压缩级别,级别越高越耗时1~9(越高压缩效果越好)
gzip_vary设置是否携带Vary:Accept-Encoding头域的响应头部on/off
gzip_buffers设置处理压缩请求的缓冲区数量和大小数量 大小,如16 8k
gzip_disable针对不同客户端的请求来设置是否开启压缩如 .Chrome.
gzip_http_version指定压缩响应所需要的最低HTTP请求版本如1.1
gzip_min_length设置触发压缩的文件最低大小如512k
gzip_proxied对于后端服务器的响应结果是否开启压缩off、expired、no-cache…
http{
  # 开启压缩机制
  gzip on;
  # 指定会被压缩的文件类型(也可自己配置其他类型)
  gzip_types text/plain application/javascript text/css application/xml text/javascript image/jpeg image/gif image/png;
  # 设置压缩级别,越高资源消耗越大,但压缩效果越好
  gzip_comp_level 5;
  # 在头部中添加Vary: Accept-Encoding(建议开启)
  gzip_vary on;
  # 处理压缩请求的缓冲区数量和大小
  gzip_buffers 16 8k;
  # 对于不支持压缩功能的客户端请求不开启压缩机制
  gzip_disable "MSIE [1-6]\."; # 低版本的IE浏览器不支持压缩
  # 设置压缩响应所支持的HTTP最低版本
  gzip_http_version 1.1;
  # 设置触发压缩的最小阈值
  gzip_min_length 2k;
  # 关闭对后端服务器的响应结果进行压缩
  gzip_proxied off;
}

在上述的压缩配置中,最后一个gzip_proxied选项,可以根据系统的实际情况决定,总共存在多种选项:

  • off:关闭Nginx对后台服务器的响应结果进行压缩。
  • expired:如果响应头中包含Expires信息,则开启压缩。
  • no-cache:如果响应头中包含Cache-Control:no-cache信息,则开启压缩。
  • no-store:如果响应头中包含Cache-Control:no-store信息,则开启压缩。
  • private:如果响应头中包含Cache-Control:private信息,则开启压缩。
  • no_last_modified:如果响应头中不包含Last-Modified信息,则开启压缩。
  • no_etag:如果响应头中不包含ETag信息,则开启压缩。
  • auth:如果响应头中包含Authorization信息,则开启压缩。
  • any:无条件对后端的响应结果开启压缩机制。

八、缓冲区

Nginx代理可暂存后端的响应,然后按需供给数据给客户端。先来看看一些关于缓冲区的配置项:

  • proxy_buffering:是否启用缓冲机制,默认为on关闭状态。
  • client_body_buffer_size:设置缓冲客户端请求数据的内存大小。
  • proxy_buffers:为每个请求/连接设置缓冲区的数量和大小,默认4 4k/8k。
  • proxy_buffer_size:设置用于存储响应头的缓冲区大小。
  • proxy_busy_buffers_size:在后端数据没有完全接收完成时,Nginx可以将busy状态的缓冲返回给客户端,该参数用来设置busy状态的buffer具体有多大,默认为proxy_buffer_size*2。
  • proxy_temp_path:当内存缓冲区存满时,可以将数据临时存放到磁盘,该参数是设置存储缓冲数据的目录。
    • path是临时目录的路径。
    • 语法:proxy_temp_path path;
  • proxy_temp_file_write_size:设置每次写数据到临时文件的大小限制。
  • proxy_max_temp_file_size:设置临时的缓冲目录中允许存储的最大容量。
  • 非缓冲参数项:
    • proxy_connect_timeout:设置与后端服务器建立连接时的超时时间。
    • proxy_read_timeout:设置从后端服务器读取响应数据的超时时间。
    • proxy_send_timeout:设置向后端服务器传输请求数据的超时时间。
http{
  proxy_connect_timeout 10;
  proxy_read_timeout 120;
  proxy_send_timeout 10;
  proxy_buffering on;
  client_body_buffer_size 512k;
  proxy_buffers 4 64k;
  proxy_buffer_size 16k;
  proxy_busy_buffers_size 128k;
  proxy_temp_file_write_size 128k;
  proxy_temp_path /soft/nginx/temp_buffer;
}

上述的缓冲区参数,是基于每个请求分配的空间,而并不是所有请求的共享空间。当然,具体的参数值还需要根据业务去决定,要综合考虑机器的内存以及每个请求的平均数据大小。
注:最后提一嘴:使用缓冲也可以减少即时传输带来的带宽消耗。
Nginx代理可暂存后端的响应,然后按需供给数据给客户端。先来看看一些关于缓冲区的配置项:

  • proxy_buffering:是否启用缓冲机制,默认为on关闭状态。
  • client_body_buffer_size:设置缓冲客户端请求数据的内存大小。
  • proxy_buffers:为每个请求/连接设置缓冲区的数量和大小,默认4 4k/8k。
  • proxy_buffer_size:设置用于存储响应头的缓冲区大小。
  • proxy_busy_buffers_size:在后端数据没有完全接收完成时,Nginx可以将busy状态的缓冲返回给客户端,该参数用来设置busy状态的buffer具体有多大,默认为proxy_buffer_size*2。
  • proxy_temp_path:当内存缓冲区存满时,可以将数据临时存放到磁盘,该参数是设置存储缓冲数据的目录。
    • path是临时目录的路径。
    • 语法:proxy_temp_path path;
  • proxy_temp_file_write_size:设置每次写数据到临时文件的大小限制。
  • proxy_max_temp_file_size:设置临时的缓冲目录中允许存储的最大容量。
  • 非缓冲参数项:
    • proxy_connect_timeout:设置与后端服务器建立连接时的超时时间。
    • proxy_read_timeout:设置从后端服务器读取响应数据的超时时间。
    • proxy_send_timeout:设置向后端服务器传输请求数据的超时时间。
http{
  proxy_connect_timeout 10;
  proxy_read_timeout 120;
  proxy_send_timeout 10;
  proxy_buffering on;
  client_body_buffer_size 512k;
  proxy_buffers 4 64k;
  proxy_buffer_size 16k;
  proxy_busy_buffers_size 128k;
  proxy_temp_file_write_size 128k;
  proxy_temp_path /soft/nginx/temp_buffer;
}

上述的缓冲区参数,是基于每个请求分配的空间,而并不是所有请求的共享空间。当然,具体的参数值还需要根据业务去决定,要综合考虑机器的内存以及每个请求的平均数据大小。

注:最后提一嘴:使用缓冲也可以减少即时传输带来的带宽消耗。

九、缓存机制

对于性能优化而言,缓存是一种能够大幅度提升性能的方案,因此几乎可以在各处都能看见缓存,如客户端缓存、代理缓存、服务器缓存等等,Nginx的缓存则属于代理缓存的一种。对于整个系统而言,加入缓存带来的优势额外明显:

  • 减少了再次向后端或文件服务器请求资源的带宽消耗。
  • 降低了下游服务器的访问压力,提升系统整体吞吐。
  • 缩短了响应时间,提升了加载速度,打开页面的速度更快。

那么在Nginx中,又该如何配置代理缓存呢?先来看看缓存相关的配置项:

  • proxy_cache_path:代理缓存的路径。
    • path:缓存的路径地址。
    • levels:缓存存储的层次结构,最多允许三层目录。
    • use_temp_path:是否使用临时目录。
    • keys_zone:指定一个共享内存空间来存储热点Key(1M可存储8000个Key)。
    • inactive:设置缓存多长时间未被访问后删除(默认是十分钟)。
    • max_size:允许缓存的最大存储空间,超出后会基于LRU算法移除缓存,Nginx会创建一个Cache manager的进程移除数据,也可以通过purge方式。
    • manager_files:manager进程每次移除缓存文件数量的上限。
    • manager_sleep:manager进程每次移除缓存文件的时间上限。
    • manager_threshold:manager进程每次移除缓存后的间隔时间。
    • loader_files:重启Nginx载入缓存时,每次加载的个数,默认100。
    • loader_sleep:每次载入时,允许的最大时间上限,默认200ms。
    • loader_threshold:一次载入后,停顿的时间间隔,默认50ms。
    • purger:是否开启purge方式移除数据。
    • purger_files:每次移除缓存文件时的数量。
    • purger_sleep:每次移除时,允许消耗的最大时间。
    • purger_threshold:每次移除完成后,停顿的间隔时间。
    • 语法:proxy_cache_path path [levels=levels] [use_temp_path=on|off] keys_zone=name:size [inactive=time] [max_size=size] [manager_files=number] [manager_sleep=time] [manager_threshold=time] [loader_files=number] [loader_sleep=time] [loader_threshold=time] [purger=on|off] [purger_files=number] [purger_sleep=time] [purger_threshold=time];
    • 是的,你没有看错,就是这么长…,解释一下每个参数项的含义:
  • proxy_cache:开启或关闭代理缓存,开启时需要指定一个共享内存区域。
    • zone为内存区域的名称,即上面中keys_zone设置的名称。
    • 语法:proxy_cache zone | off;
  • proxy_cache_key:定义如何生成缓存的键。
    • string为生成Key的规则,如 s c h e m e scheme schemeproxy_host$request_uri。
    • 语法:proxy_cache_key string;
  • proxy_cache_valid:缓存生效的状态码与过期时间。
    • code为状态码,time为有效时间,可以根据状态码设置不同的缓存时间。
    • 例如:proxy_cache_valid 200 302 30m;
    • 语法:proxy_cache_valid [code …] time;
  • proxy_cache_min_uses:设置资源被请求多少次后被缓存。
    • number为次数,默认为1。
    • 语法:proxy_cache_min_uses number;
  • proxy_cache_use_stale:当后端出现异常时,是否允许Nginx返回缓存作为响应。
    • error为错误类型,可配置timeout|invalid_header|updating|http_500…。
    • 语法:proxy_cache_use_stale error;
  • proxy_cache_lock:对于相同的请求,是否开启锁机制,只允许一个请求发往后端。
    • 语法:proxy_cache_lock on | off;
  • proxy_cache_lock_timeout:配置锁超时机制,超出规定时间后会释放请求。
    • proxy_cache_lock_timeout time;
  • proxy_cache_methods:设置对于那些HTTP方法开启缓存。
    • method为请求方法类型,如GET、HEAD等。
    • 语法:proxy_cache_methods method;
  • proxy_no_cache:定义不存储缓存的条件,符合时不会保存。
    • string为条件,例如$cookie_nocache $arg_nocache $arg_comment;
    • 语法:proxy_no_cache string…;
  • proxy_cache_bypass:定义不读取缓存的条件,符合时不会从缓存中读取。
    • 和上面proxy_no_cache的配置方法类似。
    • 语法:proxy_cache_bypass string…;
  • add_header:往响应头中添加字段信息。
    • 语法:add_header fieldName fieldValue;
  • $upstream_cache_status:记录了缓存是否命中的信息,存在多种情况:
    • MISS:请求未命中缓存。
    • HIT:请求命中缓存。
    • EXPIRED:请求命中缓存但缓存已过期。
    • STALE:请求命中了陈旧缓存。
    • REVALIDDATED:Nginx验证陈旧缓存依然有效。
    • UPDATING:命中的缓存内容陈旧,但正在更新缓存。
    • BYPASS:响应结果是从原始服务器获取的。
    • 注:这个和之前的不同,之前的都是参数项,这个是一个Nginx内置变量。
http{
  # 设置缓存的目录,并且内存中缓存区名为hot_cache,大小为128m,
  # 三天未被访问过的缓存自动清楚,磁盘中缓存的最大容量为2GB。
  proxy_cache_path /soft/nginx/cache levels=1:2 keys_zone=hot_cache:128m inactive=3d max_size=2g;
    
  server{
    location / {
      # 使用名为nginx_cache的缓存空间
      proxy_cache hot_cache;
      # 对于200、206、304、301、302状态码的数据缓存1天
      proxy_cache_valid 200 206 304 301 302 1d;
      # 对于其他状态的数据缓存30分钟
      proxy_cache_valid any 30m;
      # 定义生成缓存键的规则(请求的url+参数作为key)
      proxy_cache_key $host$uri$is_args$args;
      # 资源至少被重复访问三次后再加入缓存
      proxy_cache_min_uses 3;
      # 出现重复请求时,只让一个去后端读数据,其他的从缓存中读取
      proxy_cache_lock on;
      # 上面的锁超时时间为3s,超过3s未获取数据,其他请求直接去后端
      proxy_cache_lock_timeout 3s;
      # 对于请求参数或cookie中声明了不缓存的数据,不再加入缓存
      proxy_no_cache $cookie_nocache $arg_nocache $arg_comment;
      # 在响应头中添加一个缓存是否命中的状态(便于调试)
      add_header Cache-status $upstream_cache_status;
    }
  }
}

第一次访问时,因为还没有请求过资源,所以缓存中没有数据,因此没有命中缓存。第二、三次,依旧没有命中缓存,直至第四次时才显示命中,这是为什么呢?因为在前面的缓存配置中,我们配置了加入缓存的最低条件为:资源至少要被请求三次以上才会加入缓存。这样可以避免很多无效缓存占用空间。

十、缓存清理

如果不及时清理会导致磁盘空间被“吃光”,因此我们需要一套完善的缓存清理机制去删除缓存,在之前的proxy_cache_path参数中有purger相关的选项,开启后可以帮我们自动清理缓存,但遗憾的是:purger系列参数只有商业版的NginxPlus才能使用,因此需要付费才可使用。不过我们可以通过强大的第三方模块ngx_cache_purge来替代
安装:

1. 首先去到Nginx的安装目录下,创建一个cache_purge目录:
>mkdir cache_purge && cd cache_purge
2. 通过wget指令从github上拉取安装包的压缩文件并解压:
>wget https://github.com/FRiCKLE/ngx_cache_purge/archive/2.3.tar.gz
>tar -xvzf 2.3.tar.gz
3. 再次去到之前Nginx的解压目录下:
>cd /soft/nginx/nginx1.21.6
4. 重新构建一次Nginx,通过--add-module的指令添加刚刚的第三方模块:
>./configure --prefix=/soft/nginx/ --add-module=/soft/nginx/cache_purge/ngx_cache_purge-2.3/
5.重新根据刚刚构建的Nginx,再次编译一下,但切记不要make install:
>make
6. 删除之前Nginx的启动文件,不放心的也可以移动到其他位置:
>rm -rf /soft/nginx/sbin/nginx
7. 从生成的objs目录中,重新复制一个Nginx的启动文件到原来的位置:
>cp objs/nginx /soft/nginx/sbin/nginx

location ~ /purge(/.*) {
  # 配置可以执行清除操作的IP(线上可以配置成内网机器)
  # allow 127.0.0.1; # 代表本机
  allow all; # 代表允许任意IP清除缓存
  proxy_cache_purge $host$1$is_args$args;
}

然后再重启Nginx,接下来即可通过http://xxx/purge/xx的方式清除缓存

十一、IP黑白名单

Nginx做黑白名单机制,通过allow、deny配置项来实现:

http{
  # 屏蔽该文件中的所有IP
  # --------黑名单:---------
  deny 192.177.12.222; # 屏蔽192.177.12.222访问
  deny 192.177.44.201; # 屏蔽192.177.44.201访问
  deny 127.0.0.0/8; # 屏蔽127.0.0.1到127.255.255.254网段中的所有IP访问
 server{
    location xxx {
      # 某一系列接口只开放给白名单中的IP
      # --------白名单:WhiteIP.conf---------
      allow 192.177.12.222; # 允许192.177.12.222访问
      allow 192.177.44.201; # 允许192.177.44.201访问
      allow 127.45.0.0/16; # 允许127.45.0.1到127.45.255.254网段中的所有IP访问
      deny all; # 除开上述IP外,其他IP全部禁止访问
    }
 }
}
配置项模块参数值说明默认值
denyhttpip地址黑名单,整站屏蔽
severip地址黑名单,指定域名屏蔽
locationip地址黑名单,指定地址屏蔽
allowhttp, server, locationip地址白名单,同 deny
对于文件具体在哪儿导入,这个也并非随意的,如果要整站屏蔽/开放就在http中导入,如果只需要一个域名下屏蔽/开放就在sever中导入,如果只需要针对于某一系列接口屏蔽/开放IP,那么就在location中导入。

当然,上述只是最简单的IP黑/白名单实现方式,同时也可以通过ngx_http_geo_module、ngx_http_geo_module第三方库去实现(这种方式可以按地区、国家进行屏蔽,并且提供了IP库)。

十二、跨域配置

产生跨域问题的主要原因就在于同源策略,为了保证用户信息安全,防止恶意网站窃取数据,同源策略是必须的,否则cookie可以共享。由于http无状态协议通常会借助cookie来实现有状态的信息记录,例如用户的身份/密码等,因此一旦cookie被共享,那么会导致用户的身份信息被盗取。
同源策略主要是指三点相同,协议+域名+端口 相同的两个请求,则可以被看做是同源的,但如果其中任意一点存在不同,则代表是两个不同源的请求,同源策略会限制了不同源之间的资源交互。

location / {
  # 允许跨域的请求,可以自定义变量$http_origin,*表示所有
  add_header 'Access-Control-Allow-Origin' *;
  # 允许携带cookie请求
  add_header 'Access-Control-Allow-Credentials' 'true';
  # 允许跨域请求的方法:GET,POST,OPTIONS,PUT
  add_header 'Access-Control-Allow-Methods' 'GET,POST,OPTIONS,PUT';
  # 允许请求时携带的头部信息,*表示所有
  add_header 'Access-Control-Allow-Headers' *;
  # 允许发送按段获取资源的请求
  add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range';
  # 一定要有!!!否则Post请求无法进行跨域!
  # 在发送Post跨域请求前,会以Options方式发送预检请求,服务器接受时才会正式请求
  if ($request_method = 'OPTIONS') {
    add_header 'Access-Control-Max-Age' 1728000;
    add_header 'Content-Type' 'text/plain; charset=utf-8';
    add_header 'Content-Length' 0;
    # 对于Options方式的请求返回204,表示接受跨域请求
    return 204;
  }
}

如果后端是采用分布式架构开发的,有时候RPC调用也需要解决跨域问题,不然也同样会出现无法跨域请求的异常,因此可以在你的后端项目中,通过继承HandlerInterceptorAdapter类、实现WebMvcConfigurer接口、添加@CrossOrgin注解的方式实现接口之间的跨域配置。

十三、防盗链设计

盗链即是指外部网站引入当前网站的资源对外展示,来举个简单的例子理解:

好比壁纸网站X站、Y站,X站是一点点去购买版权、签约作者的方式,从而积累了海量的壁纸素材,但Y站由于资金等各方面的原因,就直接通过<img src=“X站/xxx.jpg” />这种方式照搬了X站的所有壁纸资源,继而提供给用户下载。
Nginx中存在一个配置项为valid_referers,正好可以满足前面的需求,语法如下:

valid_referers none | blocked | server_names | string …;
none:表示接受没有Referer字段的HTTP请求访问。
blocked:表示允许http://或https//以外的请求访问。
server_names:资源的白名单,这里可以指定允许访问的域名。
string:可自定义字符串,支配通配符、正则表达式写法。

# 在动静分离的location中开启防盗链机制
location ~ .*\.(html|htm|gif|jpg|jpeg|bmp|png|ico|txt|js|css){
  # 最后面的值在上线前可配置为允许的域名地址
  valid_referers blocked 192.168.12.129;
  if ($invalid_referer) {
    # 可以配置成返回一张禁止盗取的图片
    # rewrite   ^/ http://xx.xx.com/NO.jpg;
    # 也可直接返回403
    return   403;
  }    
  root   /soft/nginx/static_resources;
  expires 7d;
}

对于防盗链机制实现这块,也有专门的第三方模块ngx_http_accesskey_module实现了更为完善的设计,感兴趣的小伙伴可以自行去看看。

防盗链机制也无法解决爬虫伪造referers信息的这种方式抓取数据。

十四、大文件传输配置

在某些业务场景中需要传输一些大文件,但大文件传输时往往都会会出现一些Bug,比如文件超出限制、文件传输过程中请求超时等,那么此时就可以在Nginx稍微做一些配置,先来了解一些关于大文件传输时可能会用的配置项:

配置项说明
client_max_body_size设置请求体允许的最大体积
client_header_timeout等待客户端发送一个请求头的超时时间
client_body_timeout设置读取请求体的超时时间
proxy_read_timeout设置请求被后端服务器读取时,Nginx等待的最长时间
proxy_send_timeout设置后端向Nginx返回响应时的超时时间

在传输大文件时,client_max_body_size、client_header_timeout、proxy_read_timeout、proxy_send_timeout这四个参数值都可以根据自己项目的实际情况来配置。
上述配置仅是作为代理层需要配置的,因为最终客户端传输文件还是直接与后端进行交互,这里只是把作为网关层的Nginx配置调高一点,调到能够“容纳大文件”传输的程度。
当然,Nginx中也可以作为文件服务器使用,但需要用到一个专门的第三方模块nginx-upload-module,如果项目中文件上传的作用处不多,那么建议可以通过Nginx搭建,毕竟可以节省一台文件服务器资源。但如若文件上传/下载较为频繁,那么还是建议额外搭建文件服务器,并将上传/下载功能交由后端处理。

十五、配置 SSL 证书

安装时配置:http_ssl_module 模块;指令:–with-http_ssl_module
当时由于安装nginx时,未编译http_ssl_module模块,导致nginx重启失败------提示:nginx: [emerg] the “ssl” parameter requires ngx_http_ssl_module in /usr/local/nginx/···

# ----------HTTPS配置-----------
server {
  ...
  # 打开SSL加密传输
  ssl on;
  # 服务器支持的TLS版本
  ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
  ssl_buffer_size 32k;

  # 配置自己下载的数字证书
  ssl_certificate  certificate/xxx.pem;
  # 配置自己下载的服务器私钥
  ssl_certificate_key certificate/xxx.key;

  # 停止通信时,加密会话的有效期,在该时间段内不需要重新交换密钥
  ssl_session_timeout 5m;
  ssl_session_cache shared:SSL:10m;
  # 开启由服务器决定采用的密码套件
  ssl_prefer_server_ciphers on;
  # TLS握手时,服务器采用的密码套件
  ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4;
  # ssl_ciphers ECDHE-RSA-AES256-SHA384:AES256-SHA256:RC4:HIGH:!MD5:!aNULL:!eNULL:!NULL:!DH:!EDH:!AESGCM;
  location / {
    ....
  }
}

十六、高可用

线上如果采用单个节点的方式部署Nginx,难免会出现天灾人祸,比如系统异常、程序宕机、服务器断电、机房爆炸、地球毁灭…哈哈哈,夸张了。但实际生产环境中确实存在隐患问题,由于Nginx作为整个系统的网关层接入外部流量,所以一旦Nginx宕机,最终就会导致整个系统不可用,这无疑对于用户的体验感是极差的,因此也得保障Nginx高可用的特性。

通过keepalived的VIP机制,实现Nginx的高可用。VIP并不是只会员的意思,而是指Virtual IP,即虚拟IP。

keepalived在之前单体架构开发时,是一个用的较为频繁的高可用技术,比如MySQL、Redis、MQ、Proxy、Tomcat等各处都会通过keepalived提供的VIP机制,实现单节点应用的高可用。
Keepalived+重启脚本+双机热备搭建

  1. 首先创建一个对应的目录并下载keepalived安装包(提取码:s6aq)到Linux中并解压:
>mkdir /soft/keepalived && cd /soft/keepalived
>wget https://www.keepalived.org/software/keepalived-2.2.4.tar.gz
>tar -zxvf keepalived-2.2.4.tar.gz
  1. 进入解压后的keepalived目录并构建安装环境,然后编译并安装:
>cd keepalived-2.2.4
>./configure --prefix=/soft/keepalived/
>make && make install
  1. 进入安装目录的/soft/keepalived/etc/keepalived/并编辑配置文件:
>cd /soft/keepalived/etc/keepalived/
>vi keepalived.conf
  1. 编辑主机的keepalived.conf核心配置文件,如下:
global_defs {
  # 自带的邮件提醒服务,建议用独立的监控或第三方SMTP,也可选择配置邮件发送。
  notification_email {
    root@localhost
  }
  notification_email_from root@localhost
  smtp_server localhost
  smtp_connect_timeout 30
  # 高可用集群主机身份标识(集群中主机身份标识名称不能重复,建议配置成本机IP)
  router_id 192.168.12.129 
}
# 定时运行的脚本文件配置
vrrp_script check_nginx_pid_restart {
  # 之前编写的nginx重启脚本的所在位置
  script "/soft/scripts/keepalived/check_nginx_pid_restart.sh" 
  # 每间隔3秒执行一次
  interval 3
  # 如果脚本中的条件成立,重启一次则权重-20
  weight -20
}
# 定义虚拟路由,VI_1为虚拟路由的标示符(可自定义名称)
vrrp_instance VI_1 {
  # 当前节点的身份标识:用来决定主从(MASTER为主机,BACKUP为从机)
  state MASTER
  # 绑定虚拟IP的网络接口,根据自己的机器的网卡配置
  interface ens33 
  # 虚拟路由的ID号,主从两个节点设置必须一样
  virtual_router_id 121
  # 填写本机IP
  mcast_src_ip 192.168.12.129
  # 节点权重优先级,主节点要比从节点优先级高
  priority 100
  # 优先级高的设置nopreempt,解决异常恢复后再次抢占造成的脑裂问题
  nopreempt
  # 组播信息发送间隔,两个节点设置必须一样,默认1s(类似于心跳检测)
  advert_int 1
  authentication {
    auth_type PASS
    auth_pass 1111
  }
  # 将track_script块加入instance配置块
  track_script {
    # 执行Nginx监控的脚本
    check_nginx_pid_restart
  }

  virtual_ipaddress {
    # 虚拟IP(VIP),也可扩展,可配置多个。
    192.168.12.111
  }
}
  1. 克隆一台之前的虚拟机作为从(备)机,编辑从机的keepalived.conf文件,如下:
global_defs {
  # 自带的邮件提醒服务,建议用独立的监控或第三方SMTP,也可选择配置邮件发送。
  notification_email {
    root@localhost
  }
  notification_email_from root@localhost
  smtp_server localhost
  smtp_connect_timeout 30
  # 高可用集群主机身份标识(集群中主机身份标识名称不能重复,建议配置成本机IP)
  router_id 192.168.12.130 
}

# 定时运行的脚本文件配置
vrrp_script check_nginx_pid_restart {
  # 之前编写的nginx重启脚本的所在位置
  script "/soft/scripts/keepalived/check_nginx_pid_restart.sh" 
  # 每间隔3秒执行一次
  interval 3
  # 如果脚本中的条件成立,重启一次则权重-20
  weight -20
}

# 定义虚拟路由,VI_1为虚拟路由的标示符(可自定义名称)
vrrp_instance VI_1 {
  # 当前节点的身份标识:用来决定主从(MASTER为主机,BACKUP为从机)
  state BACKUP
  # 绑定虚拟IP的网络接口,根据自己的机器的网卡配置
  interface ens33 
  # 虚拟路由的ID号,主从两个节点设置必须一样
  virtual_router_id 121
  # 填写本机IP
  mcast_src_ip 192.168.12.130
  # 节点权重优先级,主节点要比从节点优先级高
  priority 90
  # 优先级高的设置nopreempt,解决异常恢复后再次抢占造成的脑裂问题
  nopreempt
  # 组播信息发送间隔,两个节点设置必须一样,默认1s(类似于心跳检测)
  advert_int 1
  authentication {
    auth_type PASS
    auth_pass 1111
  }
  # 将track_script块加入instance配置块
  track_script {
    # 执行Nginx监控的脚本
    check_nginx_pid_restart
  }

  virtual_ipaddress {
    # 虚拟IP(VIP),也可扩展,可配置多个。
    192.168.12.111
  }
}
  1. 新建scripts目录并编写Nginx的重启脚本,check_nginx_pid_restart.sh:
>mkdir /soft/scripts /soft/scripts/keepalived
>touch /soft/scripts/keepalived/check_nginx_pid_restart.sh
>vi /soft/scripts/keepalived/check_nginx_pid_restart.sh

#!/bin/sh
# 通过ps指令查询后台的nginx进程数,并将其保存在变量nginx_number中
nginx_number=`ps -C nginx --no-header | wc -l`
# 判断后台是否还有Nginx进程在运行
if [ $nginx_number -eq 0 ];then
  # 如果后台查询不到`Nginx`进程存在,则执行重启指令
  /soft/nginx/sbin/nginx -c /soft/nginx/conf/nginx.conf
  # 重启后等待1s后,再次查询后台进程数
  sleep 1
  # 如果重启后依旧无法查询到nginx进程
  if [ `ps -C nginx --no-header | wc -l` -eq 0 ];then
    # 将keepalived主机下线,将虚拟IP漂移给从机,从机上线接管Nginx服务
    systemctl stop keepalived.service
  fi
fi
  1. 编写的脚本文件需要更改编码格式,并赋予执行权限,否则可能执行失败:
>vi /soft/scripts/keepalived/check_nginx_pid_restart.sh

:set fileformat=unix # 在vi命令里面执行,修改编码格式
:set ff # 查看修改后的编码格式

>chmod +x /soft/scripts/keepalived/check_nginx_pid_restart.sh
  1. 由于安装keepalived时,是自定义的安装位置,因此需要拷贝一些文件到系统目录中:
>mkdir /etc/keepalived/
>cp /soft/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/
>cp /soft/keepalived/keepalived-2.2.4/keepalived/etc/init.d/keepalived /etc/init.d/
>cp /soft/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
  1. 将keepalived加入系统服务并设置开启自启动,然后测试启动是否正常:
>chkconfig keepalived on
>systemctl daemon-reload
>systemctl enable keepalived.service
>systemctl start keepalived.service
其他命令:
>systemctl disable keepalived.service # 禁止开机自动启动
>systemctl restart keepalived.service # 重启keepalived
>systemctl stop keepalived.service # 停止keepalived
>tail -f /var/log/messages # 查看keepalived运行时日志
  1. 最后测试一下VIP是否生效,通过查看本机是否成功挂载虚拟IP:
ip addr

看看结果:
nginx-keepalived-01

从上图中可以明显看见虚拟IP已经成功挂载,但另外一台机器192.168.12.130并不会挂载这个虚拟IP,只有当主机下线后,作为从机的192.168.12.130才会上线,接替VIP。最后测试一下外网是否可以正常与VIP通信,即在Windows中直接ping VIP:
nginx-keepalived-02
外部通过VIP通信时,也可以正常Ping通,代表虚拟IP配置成功。

  • Nginx高可用性测试
    经过上述步骤后,keepalived的VIP机制已经搭建成功,在上个阶段中主要做了几件事:
    一、为部署Nginx的机器挂载了VIP。
    二、通过keepalived搭建了主从双机热备。
    三、通过keepalived实现了Nginx宕机重启。
    由于前面没有域名的原因,因此最初server_name配置的是当前机器的IP,所以需稍微更改一下nginx.conf的配置:
sever{
  listen    80;
  # 这里从机器的本地IP改为虚拟IP
  server_name 192.168.12.111;
  # 如果这里配置的是域名,那么则将域名的映射配置改为虚拟IP
}

最后来实验一下效果:
nginx-keepalived-03

在上述过程中,首先分别启动了keepalived、nginx服务,然后通过手动停止nginx的方式模拟了Nginx宕机情况,过了片刻后再次查询后台进程,我们会发现nginx依旧存活。

从这个过程中不难发现,keepalived已经为我们实现了Nginx宕机后自动重启的功能,那么接着再模拟一下服务器出现故障时的情况:
nginx-keepalived-04

在上述过程中,我们通过手动关闭keepalived服务模拟了机器断电、硬件损坏等情况(因为机器断电等情况=主机中的keepalived进程消失),然后再次查询了一下本机的IP信息,很明显会看到VIP消失了!

现在再切换到另外一台机器:192.168.12.130来看看情况:
![nginx-keepalived-05](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=assets%2Fnginx-在这里插入图片描述

此刻我们会发现,在主机192.168.12.129宕机后,VIP自动从主机飘移到了从机192.168.12.130上,而此时客户端的请求就最终会来到130这台机器的Nginx上。

最终,利用Keepalived对Nginx做了主从热备之后,无论是遇到线上宕机还是机房断电等各类故障时,都能够确保应用系统能够为用户提供7x24小时服务。

十七、性能优化

  • 优化一:打开长连接配置
    通常Nginx作为代理服务,负责分发客户端的请求,那么建议开启HTTP长连接,用户减少握手的次数,降低服务器损耗,具体如下:
upstream xxx {
  # 长连接数
  keepalive 32;
  # 每个长连接提供的最大请求数
  keepalived_requests 100;
  # 每个长连接没有新的请求时,保持的最长时间
  keepalive_timeout 60s;
}
  • 优化二、开启零拷贝技术
    零拷贝这个概念,在大多数性能较为不错的中间件中都有出现,例如Kafka、Netty等,而Nginx中也可以配置数据零拷贝技术,如下:
sendfile on; # 开启零拷贝机制

零拷贝读取机制与传统资源读取机制的区别:

  1. 传统方式:硬件–>内核–>用户空间–>程序空间–>程序内核空间–>网络套接字
  2. 零拷贝方式:硬件–>内核–>程序内核空间–>网络套接字

从上述这个过程对比,很轻易就能看出两者之间的性能区别。

  • 优化三、开启无延迟或多包共发机制

在Nginx中有两个较为关键的性能参数,即tcp_nodelay、tcp_nopush,开启方式如下:

tcp_nodelay on;
tcp_nopush on;

TCP/IP协议中默认是采用了Nagle算法的,即在网络数据传输过程中,每个数据报文并不会立马发送出去,而是会等待一段时间,将后面的几个数据包一起组合成一个数据报文发送,但这个算法虽然提高了网络吞吐量,但是实时性却降低了。

因此你的项目属于交互性很强的应用,那么可以手动开启tcp_nodelay配置,让应用程序向内核递交的每个数据包都会立即发送出去。但这样会产生大量的TCP报文头,增加很大的网络开销。

相反,有些项目的业务对数据的实时性要求并不高,追求的则是更高的吞吐,那么则可以开启tcp_nopush配置项,这个配置就类似于“塞子”的意思,首先将连接塞住,使得数据先不发出去,等到拔去塞子后再发出去。设置该选项后,内核会尽量把小数据包拼接成一个大的数据包(一个MTU)再发送出去.

当然若一定时间后(一般为200ms),内核仍然没有积累到一个MTU的量时,也必须发送现有的数据,否则会一直阻塞。

tcp_nodelay、tcp_nopush两个参数是“互斥”的,如果追求响应速度的应用推荐开启tcp_nodelay参数,如IM、金融等类型的项目。如果追求吞吐量的应用则建议开启tcp_nopush参数,如调度系统、报表系统等。

注意:
①tcp_nodelay一般要建立在开启了长连接模式的情况下使用。
②tcp_nopush参数是必须要开启sendfile参数才可使用的。

  • 优化四、调整Worker工作进程
    Nginx启动后默认只会开启一个Worker工作进程处理客户端请求,而我们可以根据机器的CPU核数开启对应数量的工作进程,以此来提升整体的并发量支持,如下:
# 自动根据CPU核心数调整Worker进程数量
worker_processes auto;

工作进程的数量最高开到8个就OK了,8个之后就不会有再大的性能提升。

同时也可以稍微调整一下每个工作进程能够打开的文件句柄数:

# 每个Worker能打开的文件描述符,最少调整至1W以上,负荷较高建议2-3W
worker_rlimit_nofile 20000;

操作系统内核(kernel)都是利用文件描述符来访问文件,无论是打开、新建、读取、写入文件时,都需要使用文件描述符来指定待操作的文件,因此该值越大,代表一个进程能够操作的文件越多(但不能超出内核限制,最多建议3.8W左右为上限)。

  • 优化五、开启CPU亲和机制
    对于并发编程较为熟悉的伙伴都知道,因为进程/线程数往往都会远超出系统CPU的核心数,因为操作系统执行的原理本质上是采用时间片切换机制,也就是一个CPU核心会在多个进程之间不断频繁切换,造成很大的性能损耗。
    而CPU亲和机制则是指将每个Nginx的工作进程,绑定在固定的CPU核心上,从而减小CPU切换带来的时间开销和资源损耗,开启方式如下:
worker_cpu_affinity auto;
  • 优化六、开启epoll模型及调整并发连接数
    在最开始就提到过:Nginx、Redis都是基于多路复用模型去实现的程序,但最初版的多路复用模型select/poll最大只能监听1024个连接,而epoll则属于select/poll接口的增强版,因此采用该模型能够大程度上提升单个Worker的性能,如下:
events {
  # 使用epoll网络模型
  use epoll;
  # 调整每个Worker能够处理的连接数上限
  worker_connections  10240;
}

这里对于select/poll/epoll模型就不展开细说了,后面的IO模型文章中会详细剖析。




参考文档:https://mp.weixin.qq.com/s/YSiHQgIuEO4MukY-GmGZiw


若有凝问或错误,请指出,我好及时改正,让我们一起进步!
email: binary_space@126.com
qq : 103 586 2795
敲门砖: 代码谱写人生

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值