主配置中加入了时区,目的是输出日志时区默认为东八区
env TZ=Asia/Shanghai;
加入空主机头,防止直接用IP访问网站
server {
listen 80 default;
return 500;
}
日志记录真实IP
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
开启目录列表显示
autoindex on;
autoindex_localtime on;
location相关正则
/ 匹配所有请求,所以其他请求如果都不匹配,就会匹配到这里
= 严格匹配,不区分大小写,如果匹配到此块,立即处理请求
~ 区分大小写匹配,匹配后继续搜索,直到没有匹配为止
! 叹号表示不匹配
~* 不区分大小写匹配,匹配后继续搜索,直到没有匹配为止
^~ 普通匹配,匹配到后停止搜索,很适合做访问控制
防爬虫防盗链
if ($http_user_agent ~* (Scrapy|Curl|HttpClient))
{
return 403;
}
#禁止指定UA及UA为空的访问
if ($http_user_agent ~ "FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|YisouSpider|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|^$" )
{
return 403;
}
#禁止非GET|HEAD|POST方式的抓取
if ($request_method !~ ^(GET|HEAD|POST)$)
{
return 403;
}
防盗链,匹配图片请求,然后判断referer,如果为空,lvtao.net域名,Google或百度爬虫,则放行,否则return 403。如果强硬一点,none可以去掉。
location ~* \.(gif|jpe?g|png|swf|flv|rar|zip|bmp|mp3|swf)$ {
valid_referers none blocked *.dreamflyup.com server_names ~\.google\. ~\.baidu\.;
if ($invalid_referer) {
return 403;
}
}
软连接
alias /home/wwwroot/;
跳转
# 80端口重定向到443
server{
listen 80;
server_name blog.dreamflyup.com;
rewrite ^(.*)$ https://$host$1 permanent;
}
# www指向没www的
server{
listen 80;
server_name blog.dreamflyup.coom dreamflyup.com;
return 301 http://blog.dreamflyup.com$request_uri;
}
常用正则
. : 匹配除换行符以外的任意字符
? : 重复0次或1次
+ : 重复1次或更多次
* : 重复0次或更多次
\d :匹配数字
^ : 匹配字符串的开始
$ : 匹配字符串的介绍
{n} : 重复n次
{n,} : 重复n次或更多次
[c] : 匹配单个字符c
[a-z] : 匹配a-z小写字母的任意一个