python下载链接重定向_Python遵循重定向然后下载页面？

最新推荐文章于 2021-03-10 21:06:51 发布

Lin Sha

最新推荐文章于 2021-03-10 21:06:51 发布

阅读量247

点赞数

文章标签： python下载链接重定向

本文链接：https://blog.csdn.net/weixin_42176827/article/details/113499919

版权

我有以下

python脚本,它的工作原理很好.

import urllib2

url = 'http://abc.com' # write the url here

usock = urllib2.urlopen(url)

data = usock.read()

usock.close()

print data

然而,我给它的一些URL可能会重定向2次以上.在加载数据之前,如何让python等待重定向完成.

例如使用上面的代码

http://www.google.com/search?hl=en&q=KEYWORD&btnI=1

这是一个在google搜索上击中幸运按钮的等同方式,我得到：

>>> url = 'http://www.google.com/search?hl=en&q=KEYWORD&btnI=1'

>>> usick = urllib2.urlopen(url)

Traceback (most recent call last):

File "", line 1, in

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 126, in urlopen

return _opener.open(url, data, timeout)

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 400, in open

response = meth(req, response)

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 513, in http_response

'http', request, response, code, msg, hdrs)

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 438, in error

return self._call_chain(*args)

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 372, in _call_chain

result = func(*args)

File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/urllib2.py", line 521, in http_error_default

raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)

urllib2.HTTPError: HTTP Error 403: Forbidden

>>>

我试过(url,数据,超时),但我不确定该放在那里.

编辑：

我实际上发现,如果我不重定向,只是使用第一个链接的标题,我可以抓住下一个重定向的位置,并将其用作我的最终链接

关注