cookies获取方法及另一种调用cookies的方式

最新推荐文章于 2024-04-11 11:02:57 发布

夏日下的藤蔓

最新推荐文章于 2024-04-11 11:02:57 发布

阅读量1.3k

点赞数

文章标签： python 爬虫 cookie 验证码

爬虫爬网站不免遇到需要登录的问题. 登录的时候可能还会碰到需要填验证码的问题, 有的验证码甚至是拖动拼图来完成的. 虽然现在这些都有开源解决方案, 但是假设现在只是自己做个小小的不具规模的爬虫来玩一玩; 或者主要的精力想要放在如何解析 html, 或者验证抓取算法上, 而不是通过登录验证上, 那么开源解决方案并不是最好的解决方案.

更好的方案是获取浏览器的 Cookies, 然后让 requests 这个库来直接使用登录好的 Cookies

一般方式：打开浏览器的开发者模式在console里输入document.cookie，复制出来贴到代码里的

另一种方式：从电脑本地获取cookie，下面给出一个 get_chrome_cookies(url) 函数, 可以获取 Chrome 浏览器的 Cookies 信息. 程序在 Windows 下调试通过, 因为 C 盘需要特殊权限来读写文件, 因此程序先将 Cookies 数据库文件拷贝到 D 盘. 该方法用到了第三方库 win32crypt.

import sqlite3

import win32crypt

import os

def get_chrome_cookies(url):

os.system('copy "C:\\Users\\Liu\\AppData\\Local\\Google\\Chrome\\User Data\\Default\\Cookies" D:\\python-chrome-cookies')

conn = sqlite3.connect("d:\\python-chrome-cookies")

ret_list = []

ret_dict = {}

for row in conn.execute("select host_key, name, path, value, encrypted_value from cookies"):

if row[0] != url:

continue

ret = win32crypt.CryptUnprotectData(row[4], None, None, None, 0)

ret_list.append((row[1], ret[1]))

ret_dict[row[1]] = ret[1].decode()

conn.close()

os.system('del "D:\\python-chrome-cookies"')

return ret_dict

使用方法: x = requests.get(url, cookies = get_chrome_cookies(domain))

登录知乎: x = requests.get("http://www.zhihu.com, cookies=get_chrome_cookies(".zhihu.com"))

转自https://jecvay.com/2015/03/python-chrome-cookies.html

夏日下的藤蔓

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
cookies获取方法及另一种调用cookies的方式

爬虫爬网站不免遇到需要登录的问题. 登录的时候可能还会碰到需要填验证码的问题, 有的验证码甚至是拖动拼图来完成的. 虽然现在这些都有开源解决方案, 但是假设现在只是自己做个小小的不具规模的爬虫来玩一玩; 或者主要的精力想要放在如何解析 html, 或者验证抓取算法上, 而不是通过登录验证上, 那么开源解决方案并不是最好的解决方案.更好的方案是获取浏览器的 Cookies, 然后让 reques
复制链接

扫一扫

夏日下的藤蔓 CSDN认证博客专家 CSDN认证企业博客

码龄7年

13: 原创

45万+: 周排名

212万+: 总排名

9万+: 访问

: 等级

444: 积分

3: 粉丝

10: 获赞

9: 评论

28: 收藏

私信

关注

热门文章

最新评论

Mongodb连接失败问题的几种情况和解决方式
m0_53935720: 感谢，终于解决这个问题了
Webview调用相册相机失败等问题(h5交互问题)
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)使用更多的站内链接。
面试题：输出N以内所有的素数，N是一个正整数
CSDN-Ada助手: 非常感谢你分享这篇博客，探讨输出N以内所有素数的算法确实是一个非常好的话题。我觉得下一篇博客可以继续深入探讨素数相关的算法，例如如何快速判断一个数是否为素数，或者如何在大数据范围内高效地找出素数。这样的技术文章对其他用户学习算法和提高编程能力都非常有帮助。相信会有更多读者对这个话题感兴趣，期待你的下一篇博客。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
Mongodb连接失败问题的几种情况和解决方式
thugken: 问题一出现的情况，我认为是data\db这个路径没有在mongodb的文件夹里生成，所以需要先启动再链接，没验证过这个问题，只是我的一个假设，期待有人回答
Mongodb连接失败问题的几种情况和解决方式
ᴇᴍɪʟɪᴀ: 可能就是重启了电脑没有在命令行启动mongodb服务，net start mongodb

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。