requests使用cookie模拟登陆豆瓣

cookie: 一种客户端会话技术,客户登录成功后,服务端将可识别用户的凭证传到客户端,由客户端负责保存维护。一般会设定一定有效时长,在有效时长内,客户无需再次进行登录操作,可直接携带cookie登录。

本文仅演示携带cookie登陆,所以cookie通过手动获取。如何自动获取豆瓣的cookie,请看 selenium登录豆瓣网

1、手动登陆,获取cookie

获取cookie
手动将cookie复制下来。得到这样的数据:
name1=data1;name2=data2;name3=data3;…

2、cookie数据解析

将得到的cookie数据,转为字典格式

cookie_info = 'name1=data1;name2="data2"'
cookie_list = [info.strip().split('=') for info in cookie_info.split(';')]
cookies = {data[0]:data[1].replace('"','') for data in cookie_list}
print(cookies)

结果:
{'name1': 'data1', 'name2': 'data2'}
3、携带cookie登陆
import requests
cookie_info = 'your cookiedata'
cookie_list = [info.strip().split('=') for info in cookie_info.split(';')]
cookies = {data[0]:data[1].replace('"','') for data in cookie_list}
url = 'https://www.douban.com/'
headers = {
            'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5',
        }
html = requests.get(url,headers=headers,cookies=cookies).content.decode()
print(html)

结果:
登陆成功
如图,在打印的html中能看到自己的账号名称,证明登陆成功了。

思考:
登陆成功后,访问网站的其他页面,一般也需要携带cookie,才能进行访问。当然,我们可以在每个请求中,都加上cookie,但这无疑显得有些繁琐。能否在请求的时候自动携带呢?这就需要session来帮忙了。
详见下篇 requests使用session保持会话

博主其他文章推荐:
[1] 【python实用特性】-切片

[2] 【python实用特性】- 迭代、可迭代对象、迭代器

[3] 【python实用特性】- 列表生成式

[4] 【python实用特性】- yield生成器

[5] matplotlib自定义坐标轴刻度完成20万+数据的可视化

[6] Python+selenium实现自动爬取实例

[7] python爬取豆瓣Top250-改进版

[8] requests 设置请求头、代理

  • 6
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值