python aiohttp cookie解析问题

在使用Python的aiohttp库进行网络爬虫并处理登录时,遇到Cookie无法正确保存的问题。通过检查发现,网站的Cookie键包含中括号,而aiohttp的Cookie解析器不支持这种格式,导致解析失败。解决方法是修改标准库代码以兼容非标准的Cookie键值。
摘要由CSDN通过智能技术生成

python aiohttp cookie解析问题

最近在做毕业设计,是关于网络爬虫的,并且是使用python3.6版本async/await式的协程进行网络下载的。其中要爬取的网站需要登录,也是使用cookie保持登录状态的,于是我像使用requests时一样,准备使用session来自动保存登录cookie,以便在后续使用这个session继续爬取数据,然后发现了问题

问题

无论如何,aiohttp.ClientSession就是无法获取到cookie,后续get数据也是提示未登录!于是开始逐步回溯寻找原因

回溯

  1. 首先,查看session.post(login_url, data={'username': 'username', 'password': 'password'})的返回信息,看看登录是否成功,发现返回的json数据显示登录成功

  2. 查看1中的response中的headers信息,是否包含应有的Set-Cookie字段。发现的确有,问题不再这里,继续深入……

  3. 查看aiohttp.ClientSession源码,发现cookie信息来自于每一次的http response中的cookie叠加,但是我第一次的post请求中返回的cookie就没有成功更新到session.cookie_jar中,而且能够在头部中看到Set-Cookie,说明cookie解析出错

  4. 查看源码,发现cookie解析使用了标准库中的类http.cookies.SimpleCookie

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值