python 重定向获取真实url

楼主在做公司项目的时候遇到url重定向的问题,因此上网简单查找,作出如下结果

由于使用的是语言是python所以以下是python的简单解决方案

http_headers = { 'Accept': '*/*','Connection': 'keep-alive', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'}

def get_real_url(url):
    rs = requests.get(url,headers=http_headers,timeout=10)
    rs.url

以上代码未有重试机制,下面加上重试机制加以完善

def get_real_url(url,try_count = 1):
if try_count > 3:
    return url
try:
    rs = requests.get(url,headers=http_headers,timeout=10)
    if rs.status_code > 400:
        return get_real_url(url,try_count+1)
    return rs.url
except:
    return get_real_url(url, try_count + 1)
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Python中处理重定向可以通过使用requests库来实现。你可以使用该库发送HTTP请求并处理重定向。 在引用的代码示例中,当我们设置allow_redirects参数为False时,我们禁止了重定向。这意味着当我们发送请求时,如果遇到重定向,我们将不能自动获取重定向后的URL。相反,我们将收到一个状态码,指示重定向已经发生。 在引用的代码示例中,我们使用了requests库来发送一个GET请求。我们通过将allow_redirects参数设置为False来禁止重定向。然后,我们可以通过检查响应的状态码来确定是否发生了重定向。在这种情况下,状态码为302,表明发生了重定向。我们还可以通过访问响应头中的"Location"字段来获取重定向后的URL。 总结起来,可以使用以下步骤在Python中处理重定向: 1. 导入requests库 2. 创建一个会话对象 3. 设置请求头 4. 发送GET请求,并将allow_redirects参数设置为False 5. 检查响应的状态码是否为302,以判断是否发生了重定向 6. 如果发生了重定向,可以通过访问响应头中的"Location"字段来获取重定向后的URL 请注意,重定向在使用中并不常见,并且可能被视为不正当行为。搜索引擎可能会对重定向进行惩罚,并将其定义为不合法的网站。因此,在使用重定向时,请务必要谨慎并确保遵守相关规则和准则。 - https://zh.wikipedia.org/wiki/HTTP%E9%87%8D%E5%AE%9A%E5%90%91 - https://blog.csdn.net/sinat_33741547/article/details/103225426 [3] - https://www.cnblogs.com/xiugeng/p/12258099.html

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值