刚刚随心下载了一个网站里面的图片,发现了一些问题:
1.urllib.request.urlretrieve()这个函数有的时候会报错Forbiden 403,这时可以用替换为以下代码
Import requests
#url为需要下载的图片链接
res = requests.get(url)
#filename为需要下载到的本地文档名
with open(filename,“wb”) as f:
f.write(res.content)
2.如果你要爬取的url中有中文,那么请自觉使用urllib.parse这个类
代码:
import urllib.parse
word = “中文名”
word = urllib.parse.quote(word)
url = “https://(这里因为网站的特殊性就不便放出链接了,嘿嘿嘿)%s” %word
3.暂时没有第三,哈哈哈哈