3行代码教你检测爬虫，实现实时的爬虫封禁！

最新推荐文章于 2022-06-29 17:07:09 发布

工程师大胖

最新推荐文章于 2022-06-29 17:07:09 发布

阅读量991

点赞数 1

文章标签：爬虫防爬 Python

本文链接：https://blog.csdn.net/NNNJ9355/article/details/108831573

版权

是否担心别人将你的博客文章全部爬下来？

是否担心高频率爬虫导致网站瘫痪？

别担心，现在有一个Python写的神器——crawlerdetect，帮助你检测爬虫，保障网站的正常运转。

1.准备

Windows环境下打开Cmd(开始—运行—CMD)，苹果系统环境下请打开Terminal(command+空格输入Terminal)，准备开始输入命令安装依赖。

在终端输入以下命令安装我们所需要的依赖模块:

pip install crawlerdetect

看到 Successfully installed xxx 则说明安装成功。

2.使用方法

它可以通过user-agent、headers等请求头识别爬虫或机器人。

因此，你可以传递两种参数。第一种，使用user-agent检测机器人：

from crawlerdetect import CrawlerDetect
crawler_detect = CrawlerDetect(user_agent='Mozilla/5.0 (iPhone; CPU iPhone OS 7_1 like Mac OS X) AppleWebKit (KHTML, like Gecko) Mobile (compatible; Yahoo Ad monitoring; https://help.yahoo.com/kb/yahoo-ad-monitoring-SLN24857.html)')
crawler_detec

最低0.47元/天解锁文章

工程师大胖

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
3行代码教你检测爬虫，实现实时的爬虫封禁！

是否担心别人将你的博客文章全部爬下来？是否担心高频率爬虫导致网站瘫痪？别担心，现在有一个Python写的神器——crawlerdetect，帮助你检测爬虫，保障网站的正常运转。1.准备Windows环境下打开Cmd(开始—运行—CMD)，苹果系统环境下请打开Terminal(command+空格输入Terminal)，准备开始输入命令安装依赖。在终端输入以下命令安装我们所需要的依赖模块:pip install crawlerdetect看到 Successfully installed
复制链接

扫一扫