Httpd - Apache Web 服务器 禁止一切爬虫

最近发现自己的一个网站服务非常卡顿,服务请求非常慢,几乎接近崩溃的状态。查看服务进程日志,服务被疯狂CC攻击,如下图:
附图:
这边对一些入侵的IP加入了服务黑名单,过后服务的缓解了一些,但是相对应的出现的百度等相关的爬虫脚本疯狂对服务进行疯狂攻击,查阅了一些相关资料,对服务一些配置文件进行修改,具体如下步骤:

反扒内容配置robots.txt

在指定位置新建一个配置文件 robots.txt,文件内容:

User-agent: *
Disallow: /

配置 httpd.conf 文件:

# Exclude all robots
<Location "/robots.txt">
    SetHandler None
</Location>
Alias /robots.txt /path/to/robots.txt

SetHandler指令可能不是必需的,但如果您使用诸如 mod_python 之类的处理程序,则可能需要它。

技术参考:https://www.yixzm.cn/blog/524025.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值