python爬取图片

最新推荐文章于 2021-05-03 19:59:31 发布

小木头1209

最新推荐文章于 2021-05-03 19:59:31 发布

阅读量554

点赞数

分类专栏： python学习文章标签： python 爬虫

python学习专栏收录该内容

24 篇文章 1 订阅

订阅专栏

import urllib.request,socket,re,sys,os
targetPath = "D:\\python_code\\picture"
#定义文件保存路径

def saveFile(path):
#检测当前路径的有效性
if not os.path.isdir(targetPath):
os.mkdir(targetPath)
#设置每个图片的路径
pos = path.rindex('/')
t = os.path.join(targetPath,path[pos+1:])
return t
#用if __name__ == '__main__'来判断是否是在直接运行该.py文件

# 网址
url = "https://www.douban.com/"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/51.0.2704.63 Safari/537.36'
}

req = urllib.request.Request(url=url, headers=headers)

res = urllib.request.urlopen(req)

data = res.read()

for link,t in set(re.findall(r'(https:[^s]*?(jpg|png|gif))', str(data))):

print(link)
try:
urllib.request.urlretrieve(link,saveFile(link))
except:
print('失败')

小木头1209

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取图片

import urllib.request,socket,re,sys,os targetPath = "D:\\python_code\\picture" #定义文件保存路径 def saveFile(path): #检测当前路径的有效性 if not os.path.isdir(targetPath): os.mkdi
复制链接

扫一扫

专栏目录