Nginx的核心配置文件
从前面的内容学习中,我们知道Nginx的核心配置文件默认是放在
/usr/local/nginx/conf/nginx.conf
,我们就来学习下nginx.conf的内容和基本配置方法。
一、 认识nginx的配置文件
Nginx的文件内容
在Nginx的配置文件中可以使用#
来注释。
#user nobody;
worker_processes 1;
#error_log logs/error.log;
#error_log logs/error.log notice;
#error_log logs/error.log info;
#pid logs/nginx.pid;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
#log_format main '$remote_addr - $remote_user [$time_local] "$request" '
# '$status $body_bytes_sent "$http_referer" '
# '"$http_user_agent" "$http_x_forwarded_for"';
#access_log logs/access.log main;
sendfile on;
#tcp_nopush on;
#keepalive_timeout 0;
keepalive_timeout 65;
#gzip on;
server {
listen 80;
server_name localhost;
#charset koi8-r;
#access_log logs/host.access.log main;
location / {
root html;
index index.html index.htm;
}
#error_page 404 /404.html;
# redirect server error pages to the static page /50x.html
#
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
# proxy the PHP scripts to Apache listening on 127.0.0.1:80
#
#location ~ \.php$ {
# proxy_pass http://127.0.0.1;
#}
# pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
#
#location ~ \.php$ {
# root html;
# fastcgi_pass 127.0.0.1:9000;
# fastcgi_index index.php;
# fastcgi_param SCRIPT_FILENAME /scripts$fastcgi_script_name;
# include fastcgi_params;
#}
# deny access to .htaccess files, if Apache's document root
# concurs with nginx's one
#
#location ~ /\.ht {
# deny all;
#}
}
# another virtual host using mix of IP-, name-, and port-based configuration
#
#server {
# listen 8000;
# listen somename:8080;
# server_name somename alias another.alias;
# location / {
# root html;
# index index.html index.htm;
# }
#}
# HTTPS server
#
#server {
# listen 443 ssl;
# server_name localhost;
# ssl_certificate cert.pem;
# ssl_certificate_key cert.key;
# ssl_session_cache shared:SSL:1m;
# ssl_session_timeout 5m;
# ssl_ciphers HIGH:!aNULL:!MD5;
# ssl_prefer_server_ciphers on;
# location / {
# root html;
# index index.html index.htm;
# }
#}
}
Nginx的文件内容去除注释
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name localhost;
location / {
root html;
index index.html index.htm;
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
}
指令名 指令值; #全局块,主要设置Nginx服务器整体运行的配置指令
#events块,主要设置,Nginx服务器与用户的网络连接,这一部分对Nginx服务器的性能影响较大
events {
指令名 指令值;
}
#http块,是Nginx服务器配置中的重要部分,代理、缓存、日志记录、第三方模块配置...
http {
指令名 指令值;
server { #server块,是Nginx配置和虚拟主机相关的内容(一个Server就是一个虚拟主机)
指令名 指令值;
location / {
#location块,基于Nginx服务器接收请求字符串与location后面的值进行匹配,对特定请求进行处理
指令名 指令值;
}
}
...
}
简单小结
nginx.conf
配置文件中默认有三大块:全局块
、events
块、http
块。- http块中可以配置
多个server块
,每个server块又可以配置多个location块
。
二、 nginx配置文件详解
下面内容中[]
中的内容是可选的
2.1、 全局块
-
user指令
:用于配置运行Nginx服务器的worker进程的用户和用户组。语法 user 用户名[group:用户所在的组,若不指定和用户名一样] 默认值 nobody 位置 全局块
- 查看配置文件中默认的用户名
- 设置一个用户
lss
,并在nginx.conf
中添加user信息,这个用户名是可以登录到linux系统的 。 - 创建使用命令:
touch /root/html/index.html
页面,添加如下内容
-
master_process
:用来指定是否开启工作进程,改动该项配置,要重新启动nginx,执行nginx -s reload
是没有用的。语法 master_process on|off; 默认值 master_process on; 位置 全局块
-
.
worker_processes
用于配置Nginx生成工作进程的数量,这个是Nginx服务器实现并发处理服务的关键所在
。理论上来说workder process的值越大,可以支持的并发处理量也越多,但事实上这个值的设定是需要受到来自服务器自身的限制,建议将该值和服务器CPU的内核数保存一致
。
如果将work_processes
设置成2,则会看到如下内容:
-
daemon
设定Nginx是否以守护进程的方式启动。守护进程是linux后台执行的一种服务进程,特点是独立于控制终端,不会随着终端关闭而停止。
语法 | daemon on|off; |
---|---|
默认值 | daemon on; |
位置 | 全局块 |
-
将
daemon
设置为off
-
在终端1(nginx1)启动之后发现,控制台光标在下一行,
-
重新打开一个终端(nginx2),查看nginx是否启动成功。
-
将该终端1关闭,会造成nginx服务关闭,在nginx2中查看会看到已关闭。
-
pid
:用来配置Nginx当前master进程的进程号ID存储的文件路径。语法 pid file; 默认值 默认为:/usr/local/nginx/logs/nginx.pid 位置 全局块 -
error_log
:用来配置Nginx的错误日志存放路径语法 error_log file [日志级别]; 默认值 error_log logs/error.log error; 位置 全局块、http、server、location 其中日志级别的值有:
debug|info|notice|warn|error|crit|alert|emerg
,翻译过来为调试|信息|通知|警告|错误|临界|警报|紧急,这块建议大家设置的时候不要设置成info以下的等级,因为会带来大量的磁盘I/O消耗,影响Nginx的性能。 -
include
:用来引入其他配置文件,使Nginx的配置更加灵活。语法 include file; 默认值 无 位置 any
- 在
/usr/local/nginx/conf
下创建main.conf
,内容如下:
- 在
nginx.conf
配置文件中引入上述文件
- 启动nginx,并查看进程号
2.2、 events块
-
accept_mutex
用来设置Nginx网络连接序列化语法 accept_mutex on|off; 默认值 accept_mutex on; 位置 events 这个配置主要可以用来解决常说的"惊群"问题。大致意思是在某一个时刻,客户端发来一个请求连接,Nginx后台是以多进程的工作模式,也就是说有多个worker进程会被同时唤醒,但是最终只会有一个进程可以获取到连接,如果每次唤醒的进程数目太多,就会影响Nginx的整体性能。如果将上述值设置为on(开启状态),将会对多个Nginx进程接收连接进行序列号,一个个来唤醒接收,就防止了多个进程对连接的争抢。
-
·
multi_accept
用来设置是否同时接收多个网络连接。语法 multi_accept on|off; 默认值 multi_accept off; 位置 events 如果multi_accept被禁止了,nginx一个工作进程只能同时接受一个新的连接。否则,一个工作进程可以同时接受所有的新连接。建议设置为
on
。 -
worker_connections
用来配置单个worker进程最大的连接数。语法 worker_connections number; 默认值 worker_commections 512; 位置 events 这里的连接数不仅仅包括和前端用户建立的连接数,而是包括所有可能的连接数。另外,number值不能大于操作系统支持打开的最大文件句柄数量。
-
use
:用来设置Nginx服务器选择哪种事件驱动来处理网络消息。语法 use method; 默认值 根据操作系统定 位置 events 注意:此处所选择事件处理模型是Nginx优化部分的一个重要内容,method的可选值有select/poll/epoll/kqueue等,之前在准备centos环境的时候,我们强调过要使用linux内核在2.6以上,就是为了能使用epoll函数来优化Nginx。
2.2、 http块
-
定义MIME-Type
我们都知道浏览器中可以显示的内容有HTML、XML、GIF等种类繁多的文件、媒体等资源,浏览器为了区分这些资源,就需要使用MIME Type。所以说MIME Type是网络资源的媒体类型。Nginx作为web服务器,也需要能够识别前端请求的资源类型。
在Nginx的配置文件中,默认有两行配置include mime.types; default_type application/octet-stream;
default_type
:用来配置Nginx响应前端请求默认的MIME类型。语法 default_type mime-type; 默认值 default_type text/plain; 位置 http、server、location 在default_type之前还有一句
include mime.types
,include之前我们已经介绍过,相当于把mime.types文件中MIMT类型与相关类型文件的文件后缀名的对应关系加入到当前的配置文件中。
- 示例:有些时候请求某些接口的时候需要返回指定的文本字符串或者json字符串,如果逻辑非常简单或者干脆是固定的字符串,那么可以使用nginx快速实现,这样就不用编写程序响应请求了,可以减少服务器资源占用并且响应性能非常快,如何实现?
- 在nginx中的http块中的server块中,添加如下配置,然后重新加载配置文件。
- 在浏览器访问,会进行下载,因为在
mime.types
中找不到文件后缀与媒体的匹配,所以会使用默认配置default_type application/octet-stream;
进行下载。
- 添加媒体类型为:
text/plain
观察浏览器页面展示。
其中语法return 200 "<h1> This is nginx's test</h1>"
; retunrn表示返回 200 状态吗 后面显示的响应内容。 - 添加媒体类型为:
text/html
观察浏览器页面展示。
- 返回json数据示例
-
自定义服务日志
Nginx中日志的类型分为access.log、error.log
。
access.log
:用来记录用户所有的访问请求。
error.log
:记录nginx本身运行时的错误信息,不会记录用户的访问请求。
Nginx服务器支持对服务日志的格式、大小、输出等进行设置,需要使用到两个指令,分别是access_log和log_format
指令。(1)access_log:用来设置用户访问日志的相关属性。
语法 access_log path[format[buffer=size]] 默认值 access_log logs/access.log combined; 位置 http
,server
,location
(2)log_format:用来指定日志的输出格式。
语法 log_format name [escape=default|json|none] string…; 默认值 log_format combined “…”; 位置 http
- 在终端中输入
tail -f /usr/local/nginx/logs/access.log
,然后在浏览器中刷新一下,会看到一行日志记录。
- 在
nginx.conf
中加如下配置
- 访问nginx,可以看到my.log中的内容如下
-
sendfile
:用来设置Nginx服务器是否使用sendfile()
传输文件,该属性大大提高Nginx处理静态资源的性能。(建议打开)语法 sendfile on|off; 默认值 sendfile off; 位置 http、server、location nginx的简单理解。
-
keepalive_timeout
:用来设置长连接的超时时间。为什么要使用keepalive。
HTTP是一种无状态协议,客户端向服务端发送一个TCP请求,服务端响应完毕后断开连接。
如果客户端向服务端发送多个请求,每个请求都需要重新创建一次连接,效率相对来说比较低,使用keepalive模式,可以告诉服务器端在处理完一个请求后保持这个TCP连接的打开状态,若接收到来自这个客户端的其他请求,服务端就会利用这个未被关闭的连接,而不需要重新创建一个新连接,提升效率,但是这个连接也不能一直保持,这样的话,连接如果过多,也会是服务端的性能下降,这个时候就需要我们进行设置其的超时时间。语法 keepalive_timeout time; 默认值 keepalive_timeout 75s; 位置 http、server、location -
·
keepalive_requests
:用来设置一个keep-alive连接使用的次数。语法 keepalive_requests number; 默认值 keepalive_requests 100; 位置 http、server、location 总结:上面的配置,如果可以配在全局块、http块、server块,则生效的规则是
就近原则
。
Nginx服务器基础配置实例
(1)有如下访问:
http://192.168.38.129/:8081/server1/location1
访问的是:index_sr1_location1.html
http://192.168.38.129/:8081/server1/location2
访问的是:index_sr1_location2.html
http://192.168.38.129/:8082/server2/location1
访问的是:index_sr2_location1.html
http://192.168.38.129/:8082/server2/location2
访问的是:index_sr2_location2.html
(2)如果访问的资源不存在,
返回自定义的404页面
(3)将/server1和/server2的配置使用不同的配置文件分割
将文件放到/home/lss/conf.d目录下,然后使用include进行合并
(4)为/server1和/server2各自创建一个访问日志文件
-
目录结构
-
server1.conf
-
server2.conf
-
·主nginx.conf·
##全局块 begin## #配置允许运行Nginx工作进程的用户和用户组 user lss; #配置运行Nginx进程生成的worker进程数 worker_processes 2; #配置Nginx服务器运行对错误日志存放的路径 error_log logs/error.log; #配置Nginx服务器允许时记录Nginx的master进程的PID文件路径和名称 pid logs/nginx.pid; #配置Nginx服务是否以守护进程方法启动 #daemon on; ##全局块 end## ##events块 begin## events{ #设置Nginx网络连接序列化 accept_mutex on; #设置Nginx的worker进程是否可以同时接收多个请求 multi_accept on; #设置Nginx的worker进程最大的连接数 worker_connections 1024; #设置Nginx使用的事件驱动模型 use epoll; } ##events块 end## ##http块 start## http{ #定义MIME-Type include mime.types; default_type application/octet-stream; #配置允许使用sendfile方式运输 sendfile on; #配置连接超时时间 keepalive_timeout 65; #配置请求处理日志格式 log_format server1 '===>server1 access log'; log_format server2 '===>server2 access log'; ##server块 开始## include /home/www/conf.d/*.conf; ##server块 结束## } ##http块 end##
-
访问
http://192.168.38.129:8081/server1/location1/
-
访问http://192.168.38.129:8081/server1/location2/
-
访问http://192.168.38.129:8082/server2/location1/
-
访问 http://192.168.38.129:8082/server2/location2/
-
server1 的log
-
server2的log
2.3、 http块中的server块和location块
server块和location块
都是我们要重点讲解和学习的内容,因为我们后面会对Nginx的功能进行详细讲解,所以这块内容就放到静态资源部署的地方给大家详细说明。
2.31. 虚拟主机
1. 概念
虚拟主机,就是把一台物理服务器划分成多个 “虚拟” 的服务器,这样我们的一台物理服务器就可以当做多个服务器来使用,从而可以配置多个网站。Nginx 提供虚拟主机的功能,就是为了让我们不需要安装多个 Nginx,就可以运行多个域名不同的网站。或者虚拟主机技术是将一台服务器的某项或者全部服务内容逻辑划分为多个服务单位,对外表现为多个服务器,从而充分利用服务器硬件资源。
Nginx 下,一个 server 标签就是一个虚拟主机
。nginx 的虚拟主机就是通过 nginx.conf 中 server 节点
指定的,想要设置多个虚拟主机,配置多个server节点即可。
2. 虚拟主机设置的三种形式
- 基于端口号配置
- 基于域名配置
- 基于
ip
配置
2.0 补充小知识点
hosts
是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应的IP地址
建立一个关联“数据库”,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从hosts文件中寻找对应的IP地址
,一旦找到,系统会立即打开对应网页,如果没有找到,则系统会再将网址提交DNS域名解析服务器进行IP地址的解析。
windows:C:\Windows\System32\drivers\etc
centos:/etc/hosts
-
在ngin目录下的html创建了一个
lss.html
,在nginx中进行配置,
-
当我们访问
http://192.168.38.129/
,可以看到
-
如何配置成通过
www.lss.cn
域名访问到上面的页面呢?在:C:\Windows\System32\drivers\etc
中配置如下内容
-
配置文件要讲
server_name localhost
改为server_name www.lss.cn
要一样。
-
通过域名访问
2.1 基于端口号配置
基于端口的虚拟主机配置,使用端口来区分;
浏览器使用同一个域名 + 端口 或 同一个ip地址 + 端口访问;
- 如下配置
- 访问流程
2.2 基于域名的虚拟主机
基于域名的虚拟主机是最常见的一种虚拟主机
-
在
:C:\Windows\System32\drivers\etc
中在添加一个映射
-
nginx.conf配置如下
-
访问
2.3 基于ip的虚拟主机
不在给出。
2.3 虚拟主机小总结
总结:
工作中一般是不会基于IP配置的,因为哪来那么多钱买那么多IP呢,多数都是通过域名来配置,设置一下二级域名,做一个反向代理啥的。通过端口号也不多,因为我总不能在域名后面加个端口号把,十分难看且不雅。
2.3.2Nginx静态资源概述
上网去搜索访问资源对于我们来说并不陌生,通过浏览器发送一个HTTP请求实现从客户端发送请求到服务器端获取所需要内容后并把内容回显展示在页面的一个过程。这个时候,我们所请求的内容就分为两种类型,一类是静态资源、一类是动态资源。
静态资源即指在服务器端真实存在并且能直接拿来展示的一些文件,比如常见的html页面、css文件、js文件、图 片、视频等资源;
动态资源即指在服务器端真实存在但是要想获取需要经过一定的业务逻辑处理,根据不同的条件展示在页面不同这 一部分内容,比如说报表数据展示、根据当前登录用户展示相关具体数据等资源;
Nginx处理静态资源的内容,我们需要考虑下面这几个问题:
(1)静态资源的配置指令
(2)静态资源的配置优化
(3)静态资源的压缩配置指令
(4)静态资源的缓存处理
(5)静态资源的访问控制,包括跨域问题和防盗链问题
1、Nginx静态资源的配置指令
下面指令只是在这里讲解静态资源配置使用到,并不是指这些指令只能在这里使用。
-
listen指令
用来配置监听端口。语法 listen address[:port] [default_server]…;
listen port [default_server]…;默认值 listen *:80 | *:8000 位置 server listen的设置比较灵活,我们通过几个例子来把常用的设置方式熟悉下:
其中listen address[:port] [default_server]....
中的[]
是可选值,可选的所有值见
官网listen 127.0.0.1:8000; // listen localhost:8000 监听指定的IP和端口 listen 127.0.0.1; 监听指定IP的所有端口 listen 8000; 监听指定端口上的连接 listen *:8000; 监听指定端口上的连接
default_server
:default_server属性是标识符,用来将此虚拟主机设置成默认主机。所谓的默认主机指的是如果没有匹配到对应的address:port,则会默认执行的。如果不指定默认使用的是第一个server。- nginx.conf配置如下,访问
192.168.38.130:8080
- 发现浏览器可以访问到,但是浏览器中的url真的能匹配到nginx中的server_name、Listen监听端口匹配到吗?
- 那么如何自定义
default_server
呢?只要在想设置的server块中的listen 端口号 加上default_server
字样即可。
- nginx.conf配置如下,访问
-
server_name
指令
server_name:用来设置虚拟主机服务名称。关于server_name的配置方式有三种,分别是:
语法 server_name name …;
name可以提供多个中间用空格分隔默认值 server_name “”; 位置 server - 精确匹配
- 通配符匹配
- 正则表达式匹配
- 精确匹配,如:
server { listen 80; server_name www.lss.cn www.znn.cn; ... }
- 使用通配符
server_name中支持通配符"*",但需要注意的是通配符不能出现在域名的中间,只能出现在首段或尾段,如:server { listen 80; server_name *.lyy.cn www.l.*; # www.itcast.cn abc.itcast.cn www.itheima.cn www.itheima.com ... }
-
使用正则表达式
server_name中可以使用正则表达式,并且使用~
作为正则表达式字符串的开始标记。常见的正则表达式
代码 说明 ^ 匹配搜索字符串开始位置 $ 匹配搜索字符串结束位置 . 匹配除换行符\n之外的任何单个字符 \ 转义字符,将下一个字符标记为特殊字符 [xyz] 字符集,与任意一个指定字符匹配 [a-z] 字符范围,匹配指定范围内的任何字符 \w 与以下任意字符匹配 A-Z a-z 0-9 和下划线,等效于[A-Za-z0-9_] \d 数字字符匹配,等效于[0-9] {n} 正好匹配n次 {n,} 至少匹配n次 {n,m} 匹配至少n次至多m次 * 零次或多次,等效于{0,} + 一次或多次,等效于{1,} ? 零次或一次,等效于{0,1} 配置如下:
server { listen 80; server_name ~^www\.(\w)+\.cn$; default_type text/plain return 200 $1 $2; }
-
匹配执行顺序
由于server_name指令支持通配符和正则表达式
,因此在包含多个虚拟主机的配置文件中,可能会出现一个名称被多个虚拟主机的server_name匹配成功,当遇到这种情况,当前的请求交给谁来处理呢?
-
结论
No1:准确匹配server_name No2:通配符在开始时匹配server_name成功 No3:通配符在结束时匹配server_name成功 No4:正则表达式匹配server_name成功 No5:被默认的default_server处理,如果没有指定默认找第一个server
-
location指令
server{ listen 80; server_name localhost; location / { } location /abc{ } ... }
location用来设置请求的
URI
语法 location [ = | ~ | ~* | ^~ |@ ] uri{…} 默认值 — 位置 server,location uri变量是待匹配的请求字符串,可以不包含正则表达式,也可以包含正则表达式
,那么nginx服务器在搜索匹配location的时候,是先使用不包含正则表达式进行匹配,找到一个匹配度最高的一个,然后在通过包含正则表达式的进行匹配,如果能匹配到直接访问,匹配不到,就使用刚才匹配度最高的那个location来处理请求
。
属性介绍-
不带符号,要求必须以指定模式开始。
server { listen 80; server_name www.lss.cn; location /abc{ default_type text/plain; return 200 "access success"; } } 以下访问都是正确的 http://192.168.200.133/abc http://192.168.200.133/abc?p1=TOM http://192.168.200.133/abc/ http://192.168.200.133/abcdef
2.=
用于不包含正则表达式uri前
,必须与指定的模式精确匹配。server { listen 80; server_name www.lss.cn; location =/abc{ default_type text/plain; return 200 "access success"; } } 可以匹配到 http://192.168.200.133/abc http://192.168.200.133/abc?p1=TOM 匹配不到 http://192.168.200.133/abc/ http://192.168.200.133/abcdef
3.~
:用于表示当前uri
中包含了正则表达式,并且区分大小写。
4.~*
:用于表示当前uri
中包含了正则表达式,并且不区分大小写。
换句话说,如果uri包含了正则表达式,需要用上述两个符号来标识。server { listen 80; server_name 127.0.0.1; location ~^/abc/\w${ default_type text/plain; return 200 "access_success"; } } server { listen 80; server_name 127.0.0.1; location ~*^/abc/\w${ default_type text/plain; return 200 "access_success"; } }
5^~
用于不包含正则表达式的uri前,功能和不加符号的一致,唯一不同的是,如果模式匹配,那么就停止搜索其他模式了。
-
-
root
:设置请求的根目录语法 root path; 默认值 root html; 位置 http、server、location path
:为Nginx服务器接收到请求以后查找资源的根目录路径。
alias
:用来更改location的URI
语法 alias path; 默认值 — 位置 location path为修改后的根路径
。
以上两个指令都可以来指定访问资源的路径,那么这两者之间的区别是什么?
举例说明:-
在
/usr/local/nginx/html
目录下创建一个images
目录,并在目录下放入一张图片mv.png
访问图片的路径为:http://192.168.38.130/images/mv.png
-
如果把root给为
alias
再次访问上述地址,页面会出现404的错误,查看错误日志会发现是因为地址不对:改为http://192.168.38.130/images/images/mv.png
,才能正常访问。
-
原因:
root
的访问日志如下:
alias
的访问日志如下,发现路径不正确:
所以验证了
需要在alias
后面路径改为:
-
如果
location路径是以/结尾
,则alias也必须是以/结尾,root没有要求将上述配置修改为
小结root的处理结果是: root路径+location路径 alias的处理结果是:使用alias路径替换location路径 alias是一个目录别名的定义,root则是最上层目录的含义。 如果location路径是以/结尾,则alias也必须是以/结尾,root没有要求
-
-
index
指令:设置网站的默认首页语法 index file …; 默认值 index index.html; 位置 http、server、location index后面可以跟多个设置,如果访问的时候没有指定具体访问的资源,则会依次进行查找,找到第一个为止。
location / { root /usr/local/nginx/html; index index.html index.htm; } 访问该location的时候,可以通过 http://ip:port/,地址后面如果不添加任何内容,则默认依次访问index.html和index.htm,找到第一个来进行返回
-
error_page
指令
error_page :设置网站的错误页面语法 error_page code … [=[response]] uri; 默认值 — 位置 http、server、location… 出现对应的响应code后,如何来处理。 -
可以指定具体跳转的地址
-
可以指定重定向地址
-
使用
location
的@
符号完成错误信息展示 -
可选项
=[response]
的作用是用来将相应代码更改为另外一个server{ error_page 404 =200 /50x.html; location =/50x.html{ root html; } } 这样的话,当返回404找不到对应的资源的时候,在浏览器上可以看到,最终返回的状态码是200,这块需要注意下,编写error_page后面的内容,404后面需要加空格,200前面不能加空格
-
2.3.3Nginx静态资源优化配置语法
Nginx对静态资源如何进行优化配置。这里从三个属性配置进行优化:
sendfile on;
tcp_nopush on;
tcp_nodeplay on;
-
sendfile
, 用来开启高效的文件传输模式。语法 sendfile on |off; 默认值 sendfile off; 位置 http、server、location… 请求静态资源的过程:客户端通过网络接口向服务端发送请求,操作系统将这些客户端的请求传递给服务器端应用程序,服务器端应用程序会处理这些请求,请求处理完成以后,操作系统还需要将处理得到的结果通过网络适配器传递回去。
server { listen 80; server_name localhost; location / { root html; index index.html; } } 在html目录下有一个welcome.html页面,访问地址 http://192.168.38.130/welcome.html
sendfile 设置为 on
,可以看到少了一下拷贝过程。
-
tcp_nopush
:该指令必须在sendfile打开的状态下才会生效,主要是用来提升网络包的传输’效率’语法 tcp_nopush on|off; 默认值 tcp_nopush off; 位置 http、server、location -
tcp_nodelay
:该指令必须在keep-alive连接开启的情况下才生效,来提高网络包传输的’实时性’语法 tcp_nodelay on|off; 默认值 tcp_nodelay on; 位置 http、server、location
经过刚才的分析,"tcp_nopush"和”tcp_nodelay“
看起来是"互斥的"
,那么为什么要将这两个值都打开,这个大家需要知道的是在linux2.5.9以后的版本中两者是可以兼容的,三个指令都开启的好处是,sendfile
可以开启高效的文件传输模式,tcp_nopush
开启可以确保在发送到客户端之前数据包已经充分“填满”, 这大大减少了网络开销,并加快了文件发送的速度。 然后,当它到达最后一个可能因为没有“填满”而暂停的数据包时,Nginx会忽略tcp_nopush参数, 然后,tcp_nodelay强制套接字发送数据
。由此可知,TCP_NOPUSH可以与TCP_NODELAY一起设置,它比单独配置TCP_NODELAY具有更强的性能。所以我们可以使用如下配置来优化Nginx静态资源的处理
sendfile on;
tcp_nopush on;
tcp_nodelay on;
2.3.4Nginx静态资源压缩实战
经过上述内容的优化,我们再次思考一个问题,假如在满足上述优化的前提下,我们传送一个1M的数据和一个10M的数据那个效率高?,答案显而易见,传输内容小,速度就会快。那么问题又来了,同样的内容,如果把大小降下来,我们脑袋里面要蹦出一个词就是"压缩",接下来,我们来学习Nginx的静态资源压缩模块。
在Nginx的配置文件中可以通过配置gzip来对静态资源进行压缩,相关的指令可以配置在http块、server块和location块
中,Nginx可以通过
ngx_http_gzip_module模块
ngx_http_gzip_static_module模块
ngx_http_gunzip_module模块
对这些指令进行解析和处理。
接下来我们从以下内容进行学习
(1)Gzip各模块支持的配置指令
(2)Gzip压缩功能的配置
(3)Gzip和sendfile的冲突解决
(4)浏览器不支持Gzip的解决方案
Gzip模块配置指令
接下来所学习的指令都来自ngx_http_gzip_module
模块,该模块会在nginx安装的时候内置到nginx的安装环境中,也就是说我们可以直接使用这些指令。
-
gzip指令
:该指令用于开启或者关闭gzip功能语法 gzip on|off; 默认值 gzip off; 位置 http、server、location… 注意只有该指令为打开状态,下面的指令才有效果。
http{ gzip on; }
-
gzip_types指令
:该指令可以根据响应页的MIME
类型选择性地开启Gzip`压缩功能语法 gzip_types mime-type …; 默认值 gzip_types text/html; 位置 http、server、location 所选择的值可以从mime.types文件中进行查找,也可以使用
"*"
代表所有。
- 在
/usr/local/nginx/html
上传了一个novel.txt
文件.并在nginx.conf
做如下配置:
-
gzip_comp_level
指令:该指令用于设置Gzip压缩程度,级别从1-9
。1表示程度最低,但效率最高。9刚好相反,压缩程度最高,但是效率最低浪费时间。语法 gzip_comp_level level; 默认值 gzip_comp_level 1; 位置 http、server、location 一般情况下,设置为中间值:
6
。
-
gzip_vary
指令:该指令用于设置使用Gzip进行压缩发送是否携带“Vary:Accept-Encoding”头域的响应头部。主要是告诉接收方,所发送的数据经过了Gzip压缩处理
5.gzip_buffers
指令:该指令用于处理请求压缩的缓冲区数量和大小。语法 gzip_buffers number size; 默认值 gzip_buffers 32 4k|16 8k; 位置 http、server、location 其中number:指定Nginx服务器向系统申请缓存空间个数,size指的是每个缓存空间的大小。主要实现的是申请number个每个大小为size的内存空间。这个值的设定一般会和服务器的操作系统有关,所以建议此项不设置,使用默认值即可。
6.
gzip_disable
指令:针对不同种类客户端发起的请求,可以选择性地开启和关闭Gzip功能。语法 gzip_disable regex …; 默认值 — 位置 http、server、location regex
:根据客户端的浏览器标志(user-agent)来设置,支持使用正则表达式。指定的浏览器标志不使用Gzip.该指令一般是用来排除一些明显不支持Gzip的浏览器。
- 禁止edge浏览器的压缩功能
-
gzip_http_version
指令:针对不同的HTTP协议版本,可以选择性地开启和关闭Gzip功能语法 gzip_http_version 1.0|1.1; 默认值 gzip_http_version 1.1; 位置 http、server、location 该指令是指定使用Gzip的HTTP最低版本,该指令一般采用默认值即可
-
gzip_min_length
指令:该指令针对传输数据的大小,可以选择性地开启和关闭Gzip功能语法 gzip_min_length length; 默认值 gzip_min_length 20; 位置 http、server、location nignx计量大小的单位:bytes[字节] / kb[千字节] / M[兆] 例如: 1024 / 10k|K / 10m|M
Gzip压缩功能对大数据的压缩效果明显,但是如果要压缩的数据比较小的化,可能出现越压缩数据量越大的情况,因此我们需要根据响应内容的大小来决定是否使用Gzip功能,响应页面的大小可以通过头信息中的
Content-Length
来获取。但是如何使用了Chunk编码动态压缩,该指令将被忽略。建议设置为1K或以上。
-
gzip_proxied
指令:该指令设置是否对服务端返回的结果进行Gzip压缩(反向代理时用)。语法 gzip_proxied off|expired|no-cache|
no-store|private|no_last_modified|no_etag|auth|any;默认值 gzip_proxied off; 位置 http、server、location off - 关闭Nginx服务器对后台服务器返回结果的Gzip压缩
expired - 启用压缩,如果header头中包含 “Expires” 头信息
no-cache - 启用压缩,如果header头中包含 “Cache-Control:no-cache” 头信息
no-store - 启用压缩,如果header头中包含 “Cache-Control:no-store” 头信息
private - 启用压缩,如果header头中包含 “Cache-Control:private” 头信息
no_last_modified - 启用压缩,如果header头中不包含 “Last-Modified” 头信息
no_etag - 启用压缩 ,如果header头中不包含 “ETag” 头信息
auth - 启用压缩 , 如果header头中包含 “Authorization” 头信息
any - 无条件启用压缩
Gzip压缩功能的实例配置
gzip on; # 开启gizp功能
gzip_types *; # 压缩源文件类型,根据具体的访问资源类型设定(生产0环境不建议打开)
gzip_comp_level 6; # gzip压缩级别(不建议设置过大,过大值,不会对文件压缩有太大提升,但是会浪费cpu资源)
gzip_min_length 4 16K; # 缓存空间大小
gzip_http_version 1.1; # 指定压缩响应所需要的最低Http请求版本
gzip_vary on; # 网响应头信息中添加压缩标识
gzip_disable "MSIE [1-6]\." ; # 对IE6以下的版本都不进行压缩(低版本浏览器肯能不支持压缩,会造成乱码,使用该指令进行排除)
gzip_proxied off; # nginx作为反向代理压缩服务端返回数据的条件
这些配置在很多地方可能都会用到,所以我们可以将这些内容抽取到一个配置文件中,然后通过include
指令把配置文件再次加载到nginx.conf
配置文件中,方法使用。
nginx_gzip.conf
gzip on;
gzip_types *;
gzip_comp_level 6;
gzip_min_length 1024;
gzip_buffers 4 16K;
gzip_http_version 1.1;
gzip_vary on;
gzip_disable "MSIE [1-6]\.";
gzip_proxied off;
Gzip和sendfile共存问题
前面在讲解sendfile的时候,提到过,开启sendfile以后,在读取磁盘上的静态资源文件的时候,可以减少拷贝的次数,可以不经过用户进程将静态文件通过网络设备发送出去,但是Gzip要想对资源压缩,是需要经过用户进程进行操作的。所以如何解决两个设置的共存问题。
可以使用ngx_http_gzip_static_module
模块的gzip_static
指令来解决。
gzip_static
指令
gzip_static: 检查与访问资源同名的.gz文件时,response中以gzip相关的header返回.gz文件的内容。
语法 | gzip_static on | off | always; |
---|---|
默认值 | gzip_static off; |
位置 | http、server、location |
其中on
是打开,如果客户使用的客户端浏览器支持文件压缩(前面使用过:gzip_disable "MSIE [1-6]\."
来禁止那些浏览器使用压缩功能)就打开,不支持就不采用压缩;off
关闭很好理解;always
,不管浏览器是否支持压缩,就都进行压缩。
添加上述命令后,会报一个错误,unknown directive "gzip_static"
主要的原因是Nginx默认是没有添加ngx_http_gzip_static_module模块。如何来添加?
添加模块到Nginx的实现步骤
-
查询当前Nginx的配置参数
-
将nginx安装目录下sbin目录中的nginx二进制文件进行更名。目的是到时候改错了,还可以有备份。
cd /usr/local/nginx/sbin mv nginx nginxold
-
进入Nginx的安装目录
cd /root/nginx/core/nginx-1.16.1
-
执行make clean清空之前编译的内容
-
使用configure来配置参数
./configure --with-http_gzip_static_module
-
使用make命令进行编译
-
将objs目录下的nginx二进制执行文件移动到nginx安装目录下的sbin目录中
mv objs/nginx /usr/local/nginx/sbin
-
执行更新命令
gzip_static测试
直接访问http://192.168.38.130/novel.txt
三、静态资源的缓存处理
1、什么是缓存
缓存(cache)
,原始意义是指访问速度比一般随机存取存储器(RAM)快的一种高速存储器,通常它不像系统主存那样使用DRAM
技术,而使用昂贵但较快速的SRAM
技术。缓存的设置是所有现代计算机系统发挥高性能的重要因素之一。
2、什么是web缓存
Web缓存
是指一个Web资源(如html页面,图片,js,数据等)存在于Web服务器和客户端(浏览器)之间的副本。缓存会根据进来的请求保存输出内容的副本;当下一个请求来到的时候,如果是相同的URL
,缓存会根据缓存机制决定是直接使用副本响应访问请求,还是向源服务器再次发送请求。比较常见的就是浏览器会缓存访问过网站的网页,当再次访问这个URL地址
的时候,如果网页没有更新,就不会再次下载网页,而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新,浏览器才会再次下载网页
3、web缓存的种类
客户端缓存
浏览器缓存
服务端缓存
Nginx / Redis / Memcached等
浏览器缓存
是为了节约网络的资源加速浏览,浏览器在用户磁盘上对最近请求过的文档进行存储,当访问者再次请求这个页面时,浏览器就可以从本地磁盘显示文档,这样就可以加速页面的阅览.
4、为什么要用浏览器缓存
成本最低的一种缓存实现
减少网络带宽消耗
降低服务器压力
减少网络延迟,加快页面打开速度
5、浏览器缓存的执行流程
HTTP协议中和页面缓存相关的字段,我们先来认识下:
header | 说明 |
---|---|
Expires | 缓存过期的日期和时间 |
Cache-Control | 设置和缓存相关的配置信息 |
Last-Modified | 请求资源最后修改时间 |
ETag | 请求变量的实体标签的当前值,比如文件的MD5值 |
(1)用户首次通过浏览器发送请求到服务端获取数据,客户端是没有对应的缓存,所以需要发送request请求来获取数据;
(2)服务端接收到请求后,获取服务端的数据及服务端缓存的允许后,返回200的成功状态码并且在响应头上附上对应资源以及缓存信息;
(3)当用户再次访问相同资源的时候,客户端会在浏览器的缓存目录中查找是否存在响应的缓存文件
(4)如果没有找到对应的缓存文件,则走(2)步
(5)如果有缓存文件,接下来对缓存文件是否过期进行判断,过期的判断标准是(Expires)
(6)如果没有过期,则直接从本地缓存中返回数据进行展示
(7)如果Expires过期,接下来需要判断缓存文件是否发生过变化
(8)判断的标准有两个,一个是ETag(Entity Tag),一个是Last-Modified
(9)判断结果是未发生变化,则服务端返回304,直接从缓存文件中获取数据
(10)如果判断是发生了变化,重新从服务端获取数据,并根据缓存协商(服务端所设置的是否需要进行缓存数据的设置)来进行数据缓存。
强弱缓存帖子
6、浏览器缓存相关的指定
Nginx需要进行缓存相关设置,就需要用到如下的指令
-
expires指令
expires:该指令用来控制页面缓存的作用。可以通过该指令控制HTTP应答中的“Expires"和”Cache-Control"语法 expires [modified] time
expires epoch|max|off;默认值 expires off; 位置 http、server、location
time
:可以整数也可以是负数,指定过期时间,如果是负数,Cache-Control则为no-cache,如果为整数或0,则Cache-Control的值为max-age=time;
epoch
: 指定Expires的值为’1 January,1970,00:00:01 GMT’(1970-01-01 00:00:00),Cache-Control的值no-cache
max
:指定Expires的值为’31 December2037 23:59:59GMT’ (2037-12-31 23:59:59) ,Cache-Control的值为10年
off
:默认不缓存。
强缓存示例
Ctrl+shift+Del
清除缓存,禁用缓存关闭。
若缓存示例
在浏览器新打开一个标签页,否则看不出来效果。
-
expire示例
-
add_header
指令
add_header指令是用来添加指定的响应头和响应值。语法 add_header name value [always]; 默认值 — 位置 http、server、location…
Cache-Control作为响应头信息,可以设置如下值:
缓存响应指令:
Cache-control: must-revalidate
Cache-control: no-cache
Cache-control: no-store
Cache-control: no-transform
Cache-control: public
Cache-control: private
Cache-control: proxy-revalidate
Cache-Control: max-age=<seconds>
Cache-control: s-maxage=<seconds>
指令 | 说明 |
---|---|
must-revalidate | 可缓存但必须再向源服务器进行确认 |
no-cache | 缓存前必须确认其有效性 |
no-store | 不缓存请求或响应的任何内容 |
no-transform | 代理不可更改媒体类型 |
public | 可向任意方提供响应的缓存 |
private | 仅向特定用户返回响应 |
proxy-revalidate | 要求中间缓存服务器对缓存的响应有效性再进行确认 |
max-age=<秒> | 响应最大Age值 |
s-maxage=<秒> | 公共缓存服务器响应的最大Age值 |
- 示例设为
no-store