网页爬虫之cookie自动获取

最新推荐文章于 2024-08-08 18:34:38 发布

置顶

smile_milk1992

最新推荐文章于 2024-08-08 18:34:38 发布

阅读量4.1w

点赞数 8

分类专栏： python 文章标签： python 爬虫实例 cookie selenium

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30175203/article/details/52105082

版权

本文介绍了如何使用Python的selenium库结合PhantomJS模拟浏览器登录，自动获取并保存cookie，以及检查cookie有效期。当cookie过期时，程序能自动重新获取。通过这种方法，可以保持登录状态，访问需要登录的网页内容，如微博的个人主页。

摘要由CSDN通过智能技术生成

本文实现cookie的自动获取，及cookie过期自动更新。

社交网站中的很多信息需要登录才能获取到，以微博为例，不登录账号，只能看到大V的前十条微博。保持登录状态，必须要用到Cookie。以登录www.weibo.cn 为例：

在chrome中输入：http://login.weibo.cn/login/

分析控制台的Headers的请求返回，会看到weibo.cn有几组返回的cookie。

实现步骤：

1，采用selenium自动登录获取cookie，保存到文件;

2，读取cookie，比较cookie的有效期，若过期则再次执行步骤1；

3，在请求其他网页时，填入cookie，实现登录状态的保持。

1，在线获取cookie

采用selenium + PhantomJS 模拟浏览器登录，获取cookie；

cookies一般会有多个，逐个将cookie存入以.weibo后缀的文件。

def get_cookie_from_network()<

最低0.47元/天解锁文章

关注

8
点赞
踩
58

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。