【学习心得】Cookie反爬虫技术原理和分类

小oo呆

已于 2024-03-14 04:23:29 修改

阅读量1.7k

点赞数 11

分类专栏：【学习心得】文章标签：爬虫网络安全网络爬虫

于 2024-03-11 03:20:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39780701/article/details/136612768

版权

一、Cookie反爬虫技术原理

（1）什么是Cookie反爬虫？

Cookie反爬虫是指服务器通过校验请求头中的Cookie值来区分正常用户和爬虫的手段，深入来说一般服务器对Cookie的有效性、时效性和内容进行校验，确认请求来自于已授权或已登录的用户。

如果爬虫仅仅是简单地抓取网页而不处理或模拟正常浏览器的Cookie行为，那么服务器就可能通过检查请求头中缺失或无效的Cookie信息来判断这个请求并非来自真实的用户，从而触发反爬虫策略，如拒绝服务、返回错误信息、限制访问速度或频率等。

（2）Cookie反爬虫原理

① 服务器直接响应的Cookie反爬

浏览器向服务器发送请求，服务器直接在HTTP响应头中设置Cookie，下次请求的时候需要再带上Cookie去进行请求。

例如，服务器可能会设置一个有效期较短、内容随机生成的Token作为Cookie，每次请求都需要验证此Token的有效性和一致性来判断是否为合法用户。

② 服务器响应的JS生成Cookie反爬

浏览器向服务器发送请求，服务器返回的是一段JS代码，浏览器需要解析JS代码，通过JS代码生成的Cookie再去请求服务器，从而得到真正想要的数据。

例如，服务器通过返回HTML页面中嵌入JavaScript代码来动态生成和设置Cookie。由于许多基础爬虫不执行JavaScript，因此无法获取到由JavaScript生成的Cookie信息。服务器可能使用这种方式来隐

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。