requests.get得到的headers信息不全

最新推荐文章于 2024-03-01 10:54:10 发布

Z-Fool

最新推荐文章于 2024-03-01 10:54:10 发布

阅读量2.4k

点赞数 2

分类专栏：学习路上文章标签： python

本文链接：https://blog.csdn.net/zyhqjzxl/article/details/119536477

版权

学习路上专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在使用python工作时，有情况下会需要对有状态302的重定向网站的响应返回信息headers进行解析和现有url拼接，以此来获得目标网页的最终目标url。

其中我使用的是requests库，用 requests.get(url) 对网页内容进行获取，然后对获取到信息的headers进行解析，结果发现获取的信息有缺失，例如Set-Cookie,Location等内容并没有获取到。后来我尝试使用requests.head(url).headers方法获取headers信息，就成功了，headers信息没有缺失。

~~目前出现这个问题的原因我还在继续探究，如果有大佬知道是什么原因的话希望不吝赐教。~~

出大错了，get直接就是跳转后的网页的headers，而requests.head仅仅只是中间网页的headers，我都不用拼接url了，直接get获取的response.url输出一下就是我需要的url。一开始确实给我整懵了，到底还是第一次碰到，一开始没想明白