一、Nginx的指令
Nginx Rewrite规则相关指令有if、rewrite、set、return、break等,其中rewrite是最关键的指令。一个简单的Nginx Rewrite规则语法如下:
如果加上if语句,示例如下:
if(!-f $request_filename) {
rewrite ^/img/(.*)$ /site/images/$1 last;
}
1、break 指令
语法:break
默认值:none
使用环境:server, location, if
该指令的作用是完成当前的规则集,不再处理rewrite指令。
2、if指令
语法:if(condition) {…}
默认值:none
使用环境:server,location
该指令用于检查一个条件是否符合,如果条件符合,则执行大括号内的语句。if指令不支持嵌套,不支持多个条件&&和|| 处理。
以下信息可以被指定为条件:
(1)变量名,错误的值包括:空字符串“”,或者任何以0开始的字符串;
(2)变量比较可以使用“=”(表示等于)和“!=”(表示不等于)运算符;
(3)正则表达式模式匹配可以使用“~*”和“~”符号;
(4)“~”符号表示区分大小写字母的匹配;
(5)“~*”符号表示不区分大小写字母的匹配(例如firefox与firefox是匹配的);
(6)“!~”和“!~*”符号的作用刚好和“~”、“!~*”相反,表示不匹配;
(7)“-f”和“!-f”用来判断文件是否存在;
(8)“-d”和“!-d”用来判断目录是否存在;
(9)“-e”和“!-e”用来判断文件或目录是否存在;
(10)“-x”和“!-x”用来判断文件是否可执行。
部分正则表达式可以在圆括号()内,其值可以通过后面的变量$1至$9访问,示例如代码所示:
if ($request_uri ~* "test") {
set $proxy_url http://localhost:8081/$request_uri;
}
3、return指令
语法:return code
默认值:none
使用环境:server,location,if
该指令用于结束规则的执行并返回状态码给客户端。状态码可以使用这些值:204,400,402~406,408,410,411,413,416及500-504。此外,非标准状态码444将以不发送任何Header头的方式结束连接。
示例,如果访问的URL以“.sh”和“.Bash”结尾,则返回状态码403
location ~ .*\.(sh|bash)?$ {
return 403;
}
4、rewrite 指令
语法:rewrite regex replacement flag
默认值:none
使用环境:server,location,if
该指令根据表达式来重定向URI,或者修改字符串。指令根据配置文件中的顺序来执行。
注意重写表达式只对相对路径有效。如果你想配对主机名,你应该使用if语句,代码如下:
if ($host ~* www\. (.*)) {
set $host_without_www $1;
rewrite ^(.*)$ http://$host_without_www$1 permanent; # $1 contains ‘/foo’, not !www.mydomain.com/foo’
}
如果替换串以http://开头,将会采用301和302跳转进行URL重定向。
rewrite指令的最后一项参数为flag标记,支持的flag标记有:
- last——相当于Apache里的[L]标记,支持的flag标记有:
- break——本条规则匹配完成后,终止匹配,不再匹配后面的规则;
- redirect——返回302临时重定向,浏览器地址栏会显示跳转后的URL地址;
- permanent——返回301永久重定向,浏览器地址栏会显示跳转后的URL地址。
在以上的标记中,last和break用来实现URI重写,浏览器地址栏的URL地址不变,但在服务器访问的路径发生了变化。redirect和permanent用来实现URL跳转,浏览器地址栏会显示跳转后的URL地址。
last和break标记的实现功能类似,但二者之间有细微的差别,使用alias指令时必须用last标记,使用proxy_pass指令时要使用break标记。last标记在本条rewrite规则执行完毕后,会对其所在的server{…}标签重新发起请求,而break标记则在本条规则匹配完成后,终止匹配,不再匹配后面的规则。例如以下这段规则,就必须使用break标记,使用last标记会导致死循环:
location /cms {
proxy_pass http://test.yourdomain.com;
rewrite “^/cms/(.*)\.html” /cms/index.html break;
}
因此,一般在跟location中(即location/{…})或直接在server标签中编写rewrite规则,推荐使用last标记,在非根location中(例如location /cms/{…}),则使用break标记。例如:
location /download/ {
rewrite ^(/download/.*)/media/(.*)\..*$ $1/mp3/$2.mp3 break;
rewrite ^(/download/.*)/audio/(.*)\..*$ $1/mp3/$2.ra break;
}
如果被替换的URI中含有参数(及类似/app/test.php?id=5之类的URI),默认情况下参数会被自动附加到替换串上,你可以通过在替换串的末尾加上?标记来解决这一问题。
rewrite ^/test(.*)$ http://www.yourdomain.com/home permanent;
下面我们来比较一下,不加?标记和加上?标记的URL跳转区别:
访问http://www.yourdomain.com/test?id=5 经过301跳转后的URL地址为:
http://www.yourdomain.com/home?id=5
注:对花括号({})来说,它们既能用在重定向的正则表达式里,也能用在配置文件里分割代码块,为了避免冲突,正则表达式里如果带括号,应该用双引号(或者单引号)包围。比如:
/photoes/123456
重定向到:
/path/to/photos/12/1234/123456.png
方法:
rewrite “photos/([0-9]{2}) ([0-9]{2}) ([0-9]{2})” /path/to/photos/$1/$1$2/$1$2$3.png
5、set指令
语法:set veriable value
默认值:none
使用环境:server, location, if
该指令用于定义一个变量,并给变量赋值。变量的值可以为文本、变量及文本变量的联合。
示例如下:
set vername ‘hello’;
二、Nginx的全局变量
- $args
- $content_length
- $content_type
- $document_root
- $document_uri
- $host
- $http_user_agent
- $http_cookie
- $limit_rate
- $request_body_file
- $request_method
- $remote_addr
- $remote_port
- $remote_user
- $request_filename
- $request_uri
- $query_string
- $scheme
- $server_protocol
- $server_addr
- $server_name
- $server_port
- $uri
三、PCRE 正则表达式语法
字符 | 描述 |
---|---|
\ | 将下一个字符标记为一个特殊字符,或一个原义字符,或一个向后引用,或一个八进制转义符。例如,“\n”匹配一个换行符。序列”\”匹配”\”而“(”则匹配“(” |
^ | 匹配输入字符串的结束为止。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之后的位置 |
$ | 匹配输入字符串的结束位置。 |
* | 匹配前面的子表达式零次或多次 |
+ | 匹配前面的子表达式一次或多次。 |
? | 匹配前面的子表达式一次或多次。 |
{n} | n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o。 |
{n,} | n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*” |
{n,m} | m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个“o”。“o{0,1}”等价于“o?” |
. | 匹配除“\n”之外的任何单个字符。要匹配包括“\n”在内的任何字符,使用”[.\n]” |
x|y | 匹配x或y。例如,“z |
[xyz] | 字符集合。匹配所包含的任意一个字符。例如,”[abc]”可以匹配“plain”中的“a” |
[^xyz] | 负值字符集合。匹配未包含的任意字符。例如,”[^abc]”可以匹配“plain”中的“p” |
[a-z] | 字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配到“a”到“z”范围内的任意小写字符字符 |
[^a-z] | 字符范围。匹配任何不在指定范围内的任意字符 |
\b | 匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er” |
\B | 匹配非单词边界,也就是指单词和空格间的位置。例如,“er\b”不可以匹配“never”中的“er”,但能匹配“verb”中的“er” |
\d | 匹配一个数字字符。等价于[0-9] |
\D | 匹配一个非数字字符。等价于[^0-9] |
\f | 匹配一个换页符。等价于\x0a和\cL |
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\s | 匹配任何空白字符,包含空格、制表符、换页符。等价于[\f\n\r\t\v] |
\S | 匹配任何非空白字符 |
\t | 匹配一个制表符 |
\v | 匹配一个垂直制表符 |
\w | 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]” |
\W | 匹配任何非单词字符。 |
\xn | 匹配n,其中n为十六进制转移值。如“\x41”匹配“A” |
四、Nginx的Rewrite规则编写实例
①文件和目录不存在时,重定向到某个PHP文件上,适用于WordPress等MVN结构的开源博客系统:
if (!-e $request_filename) {
rewrite ^/(.*)$ /index.php last;
}
②多目录转成参数
abc.domian.com/sort/2 => abc.com.com/index.php?act=sort&name=abc&id=2
if ($host ~* (.*)\.domain\.com) {
set $sub_name $1;
rewrite ^/sor\/(\d+)\/?$ /index.php?act=sort&cid=$sub_name&id=$1 last;
}
③目录对换/123456/xxxx -> /xxxx?id=123456:
rewrite ^/(\d+)/(.+)/ /$2?id=$1 last;
如果客户端使用IE浏览器,则重定向到/nginx-ie目录下:
if ($http_user_agent ~ MSIE) {
rewrite ^(.*)$ /nginx-ie/$1 break;
}
④禁止访问多个目录:
location ~ ^/(cron | templates)/ {
deny all;
break;
}
⑤禁止访问以/data开头的文件:
location ~ ^/data {
deny all;
}
⑥设置某些类型文件的浏览器缓存时间:
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$ {
expires 1h;
}
⑦将多级目录下的文件转换成一个文件/job-123-456-789.html 指向/job/123/456/789.html:
rewrite ^/job-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /job/$1/$2/$3.html last;
⑧禁止访问以.sh、.flv、.mp4为文件名后缀的URL地址:
location ~ .*\.(sh|flv|mp4)?$ {return 403;}
⑨允许指定的域名访问本站,其他域名一律跳转
if ($host ~* ^(.*?)\.aaa\.com$) {
set $var_tz ‘1’;
}
if ($host ~* ^192\.168\.1\.(.*?)$) {
set $var_tz ‘1’;
}
if ($host ~* ^localhost) {
set $var_tz ‘1’;
}
if ($var_tz !~ ‘1’){
rewrite ^/(.*)$ http://www.aaa.com/ redirect;
}
⑩URL重写与反向代理同时进行
location /news/ {
proxy_pass http://server.domain.com/;
}
①①指定URL之外的URL进行Rewrite跳转
if ($request_uri ~* “^/test/admin/.*”){
set $var_test_admin ‘1’;
}
if ($request_uri ~* “^/test/map/.*”){
set $var_test_admin ‘1’;
}
if ($request_uri ~* “^/test/accounts/.*”){
set $var_test_admin ‘1’;
}
if ($request_uri ~* “^/test/ajax/.*”){
set $var_test_admin ‘1’;
}
if ($request_uri !~ ‘1’ ){
rewrite ^/test/(.*?)/(.*?)/$ /test/$2.php?name=$1 last;
}
Bo-blog开源PHP博客系统伪静态重写规则:
if (!-x $request_filename) {
rewrite ^/post/([0-9]+)/?([0-9]+)?/?([0-9]+)?/?$ /read.php?entryid=$1&page=$2&part=$3 last;
}
rewrite ^/page/([0-9]+)/([0-9]+)/?$ /index.php?mode=$1&page=$2 last;
rewrite ^/starred/([0-9]+)/?([0-9]+)?/?$ /star.php?mode=$1&page=$2 last;
rewrite ^/category/([^/]+)/?([0-9]+)?/?([0-9]+)?/?$ /index.php?go=archive&cm=$1&cy=$2&mode=$3&page=$5 last;
rewrite ^/category\_([0-9]+)\_([0-9]+)\_([0-9]+)\.htm$ http://$short/category/$1/$2/$3/ permanent;
rewrite ^/category\_([0-9]+)\.htm$ http://$host/category/$1/ permanent;