cookie模拟登录

最新推荐文章于 2025-01-07 17:25:39 发布

csliudh

最新推荐文章于 2025-01-07 17:25:39 发布

阅读量5.7k

点赞数 2

分类专栏： python爬虫 python 文章标签： python爬虫 cookie 模拟登录知乎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19332527/article/details/79414303

版权

python 同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

我这里使用的是python中的requests.get(url,headers,cookies).

其中headers和cookies都是字典形式。headers作用是模拟浏览器，告诉服务器我不是爬虫。cookies作用是模拟用户，告诉服务器我不是机器人，我是某某用户。

以知乎为例，headers可以用模板：

headers = {
'Host': 'www.zhihu.com',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3',
'Accept-Encoding': 'gzip, deflate',
'Referer': 'http://www.baidu.com',
'Connection': 'keep-alive',
'Cache-Control': 'max-age=0',

}

然后就是cookies，cookies我是先在浏览器中登录，然后去找cookie，并把内容复制到txt中，到时候爬虫直接去读取txt，并转换成字典。具体过程如下（以google浏览器为例）：

1、登录知乎：http://www.zhihu.com

2、打开浏览器设置--->高级--->隐私设置和安全性-->内容设置-->cookie-->查看所有cookie和网站数据

3、搜索zhihu，得到下图

打开zhihu.com那个，如下图

这四个就是cookie的键，打开向下的箭头里面有值，根据这个建立字典即可。（注意：有的值包含着双引号，不能搞丢了）

访问时，html=requests.get("https://www.zhihu,com",headers=headers,cookies=cookies)

content=html.text

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。