爬取网站要登录？46行代码解决问题，python爬虫随心所欲

最新推荐文章于 2024-09-03 16:35:17 发布

lamehd

最新推荐文章于 2024-09-03 16:35:17 发布

阅读量1.2k

点赞数 2

文章标签：程序员编程学习开发 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lamehd/article/details/102215969

版权

本文介绍了如何处理需要登录才能爬取数据的网站。通过理解Cookie的工作原理，可以利用Python爬虫携带登录后的Cookie获取信息。以“逼乎”为例，展示如何观察并获取Cookie，实现无需手动登录即可抓取数据。另外还提到了Selenium自动登录法，通过模拟用户操作获取Cookie，进一步实现自动化爬取。

摘要由CSDN通过智能技术生成

当你在爬某些网站的时候，需要你登录才可以获取数据，咋整？莫慌，把这几招传授给你，让你以后随心所欲的爬！

一：Cookie大法

你平常网站浏览的时候，是不是发现你只要登录一次，就可以一直看到你想要的内容，过了一阵子才需要再次登录？其实每个使用这个网站的人，服务器都会给他一个 Cookie，下次你再请求数据的时候，顺带把这个 Cookie 传过去，服务器一看，有登录过，直接返回数据给他吧！

在服务中还可以设置 Cookie 的有效时间，也就是说，当你下次携带一个过期了的 Cookie 给服务器的时候，虽然知道你是老客户，但是还是需要你重新再登录一次，然后再给你一个有效的 Cookie，Cookie 的时长周期是服务器那边定的。

了解了这一点之后，我们就来正式解决问题吧！我们以“逼乎”为例：

https://biihu.cc/account/login/

输入地址之后，按一下 F12，点击 network 标签，然后登录你的帐号，然后点击其中一个，你就可以看到在 Request Headers 有你的 Cookie

<

最低0.47元/天解锁文章

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
爬取网站要登录？46行代码解决问题，python爬虫随心所欲

当你在爬某些网站的时候，需要你登录才可以获取数据，咋整？莫慌，把这几招传授给你，让你以后随心所欲的爬！一：Cookie大法你平常网站浏览的时候，是不是发现你只要登录一次，就可以一直看到你想要的内容，过了一阵子才需要再次登录？其实每个使用这个网站的人，服务器都会给他一个 Cookie，下次你再请求数据的时候，顺带把这个 Cookie 传过去，服务器一看，有登录过，直接返回数据给他吧！...
复制链接

扫一扫

博客等级

码龄6年

208
原创

247
点赞

1015
收藏

109
粉丝

关注

私信

分类专栏

python 40篇

最新评论

C、python、Java都会，却不精通，如何把一门语言学到精通？
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8008121, 请多输出高质量博客, 帮助更多的人
详解numpy矩阵的创建与数据类型
万里江山似锦绣: 感觉这的‘矩阵’，叫法不太正确，叫数组更合适些。矩阵是np.matrix()创建
3分钟，让你学会区分python中self与__init__？
亚瑟不要沉默: 挺通俗的，在应用层面，哈哈，感谢
实用技巧——Python实现从Excel读取数据并绘制成图像
m0_73784880: 意思是 int object has no attribute “append”怎么搞
拷贝数据几小时？python63行代码轻松复制500G文件
qq_58145401: 写的真乱

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。