关于如何获取动态cookies的爬取策略

#不吃香菜

于 2024-08-13 10:36:01 发布

阅读量341

点赞数 2

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li2437948121/article/details/141157182

版权

当我们爬取一些网站时，经常会遇到爬取时需要添加cookies,来判断你是否为游客登录还是用户登录。此时的cookies中还带有关于时间的参数，只要超过规定时间，爬取过程中就会报错，爬虫工程师只能通过加解密js的方式来进行操作。但是对于刚入手的小白来说，动态cookies着实有点难搞，那么有没有更加简便的的方法来获取动态的cookies呢？

在遇到此类问题，我们可以通过一个自动化的模块DrissionPage来获取到动态cookies来为我们的爬虫服务。DrissionPage时结合selenium和中间人代理攻击的一个关于python的第三方模块，如果你熟悉selenium那么DrissionPage就可以很快速的上手。

思路：使用DrissionPage通过获取用户浏览器的缓存数据，来访问用户已经登陆的网站信息返回动态的cookies的值，通过此cookies结合requests或scrapy来访问网页的数据。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄3年

39
原创

567
点赞

447
收藏

440
粉丝

关注

私信

热门文章

最新评论

爬虫相关面试题（其二）
秋说: 很棒的文章！！有个合作，有意参加可以私信我
探索视觉魔法：深入解析CSS魔幻效果的创造与实现
CSDN-Ada助手: 恭喜您发布了第20篇博客，标题看起来非常吸引人！深入解析CSS魔幻效果的创造与实现，听起来就像是一场视觉盛宴。希望您能继续保持创作的热情和耐心，不断探索视觉魔法的奥秘。或许下一步可以尝试结合其他前端技术，打造更加绚丽多彩的效果，期待您的更多精彩作品！
Mysql，MongoDB,Redis的横纵向对比
ha_lydms: 这篇博客真是让我眼前一亮，作者对于话题的探讨方式非常独到。
掌握Ubuntu必备技能：Linux基础操作，助你轻松驾驭Linux系统
CSDN-Ada助手: 恭喜您写了第18篇博客！标题“掌握Ubuntu必备技能：Linux基础操作，助你轻松驾驭Linux系统”看起来非常吸引人，内容也一定十分有用。希望您能继续保持创作的热情，分享更多关于Linux系统的知识和经验。或许下一步可以深入探讨一些高级操作技巧或者实战经验，让读者能够更全面地了解Linux系统。期待您的下一篇博客！
掌握Redis，看完这篇文章就够了
CSDN-Ada助手: 恭喜您写了第16篇博客，标题也很吸引人！对于掌握Redis的文章，您的解读很详细，让我受益匪浅。希望您能继续保持创作的热情，继续分享更多关于技术方面的知识。如果可能的话，我建议您可以尝试写一些实际应用场景下的案例分析，这样会更加丰富和实用。期待您的下一篇文章！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。