常见的反爬策略汇总

最新推荐文章于 2024-06-28 23:43:40 发布

害死猫的酒馆

最新推荐文章于 2024-06-28 23:43:40 发布

阅读量2.2k

点赞数 2

分类专栏：爬虫文章标签：爬虫数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40074627/article/details/86523458

版权

爬虫专栏收录该内容

14 篇文章 0 订阅

订阅专栏

1. 限制IP地址单位时间的访问次数
2. 用户登录才能访问网站内容, 若识别为爬虫账号,封禁IP
3. header, User-Agent检查用户所用客户端的种类和版本, 在请求头中加入CSRF_token识别用户请求(参考form表单验证)
4. Referer, 检查请求由哪里来，通常可以做图片的盗链判断
5. Cookies,检测Cookie中session_id 的使⽤用次数，如果超过限制，就触发反爬策略略
6. 动态加载,网站使用ajax动态加载内容
7. 对前端请求的API的参数进行加密
8. 对网站JS进行混淆加密(适用于对API参数加密的情况,对用于加密的JS进行混淆)
9. 在用户登录时,进行验证码验证(图片验证码或滑动验证码或短信验证码等)
10. 对网页数据展示的总页数进行限制,比如用户只能浏览200页

害死猫的酒馆

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

害死猫的酒馆

博客等级

码龄7年

26
原创

12
点赞

122
收藏

8
粉丝

关注

私信

热门文章

分类专栏

大数据 18篇
推荐系统 6篇
爬虫 14篇
selenium 3篇
chrome 1篇
google 1篇
python 5篇
pyppeteer
hadoop 3篇
spark 1篇

最新评论

Centos7安装Selenium+chrome+chromedriver详细
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(3)使用标准目录。
学习记录, 带你玩转Pyppeteer (全干货)
佛山靓仔: 大佬，想请教一下 page.on 监听请求的时候有很多请求并没有监听到，是什么回事
学习记录, 带你玩转Pyppeteer (全干货)
tingfengsishui: 入门好东西，空了好好琢磨下，尤其是可以对请求和相应作出修改

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。