user_agent用来识别访问者的操作系统(包括版本号)浏览器(包括版本号)和用户个人偏好的代码

比如我们的服务器网站,会被一些搜索引擎的爬虫程序访问,这对服务器压力造成了一定的影响。我们就可以根据爬虫的user_agent标示,来禁止掉它访问网站。


可以用location语句,也可以不用。在全局插入以下代码。

#全局配置黑名单,禁止访问网站

#   deny 127.0.0.1;

#   deny 192.168.1.0/24;

if ($http_user_agent ~* 'curl|baidu|111111')   #~为匹配 ~*为忽略大小写匹配

{

    return 403;

}



测试:

curl -x192.169.11.101:80 www.llzdwyp.com -I 显示 403 forbidden

curl -A "llzdwyp" -x192.168.11.101:80 www.llzdwyp.com -I  模拟user_ageng为llzdwyp,显示301正常

用360浏览器打开网页,显示正常。因为user-agent是Mozilla