在使用python工作时,有情况下会需要对有状态302的重定向网站的响应返回信息headers进行解析和现有url拼接,以此来获得目标网页的最终目标url。
其中我使用的是requests库,用 requests.get(url) 对网页内容进行获取,然后对获取到信息的headers进行解析,结果发现获取的信息有缺失,例如Set-Cookie,Location等内容并没有获取到。后来我尝试使用requests.head(url).headers方法获取headers信息,就成功了,headers信息没有缺失。
目前出现这个问题的原因我还在继续探究,如果有大佬知道是什么原因的话希望不吝赐教。
出大错了,get直接就是跳转后的网页的headers,而requests.head仅仅只是中间网页的headers,我都不用拼接url了,直接get获取的response.url输出一下就是我需要的url。 一开始确实给我整懵了,到底还是第一次碰到,一开始没想明白