urllib.request.urlretrieve及添加headers

最新推荐文章于 2023-02-28 10:23:02 发布

半日闲12138

最新推荐文章于 2023-02-28 10:23:02 发布

阅读量2.1k

点赞数

分类专栏：爬虫文章标签：爬虫学习

本文链接：https://blog.csdn.net/feiYu12138/article/details/102513884

版权

爬虫专栏收录该内容

17 篇文章 0 订阅

订阅专栏

下载图片：

import urllib.request

# url = "http://www.baidu.com/"
#
# response = urllib.request.urlretrieve(url, "hh.html")
#
# print(response)

image_url = "https://img04.sogoucdn.com/net/a/04/link?url=https%3A%2F%2Fi02piccdn.sogoucdn.com%2F7b90f00ce282f336&appid=122"
print(urllib.request.urlretrieve(image_url, "lz.png"))

请求头：

import urllib.request

url = "http://www.baidu.com/"

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}

request = urllib.request.Request(url=url, headers=headers)

response = urllib.request.urlopen(request)

print(response)

报错：urllib.error.URLError: <urlopen error no host given>
解决：url出现问题

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

半日闲12138

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
urllib.request.urlretrieve及添加headers

下载图片：import urllib.request# url = "http://www.baidu.com/"## response = urllib.request.urlretrieve(url, "hh.html")## print(response)image_url = "https://img04.sogoucdn.com/net/a/04/link?url=ht...
复制链接

扫一扫