利用python爬取图片,节省不必要的时间
找到一个喜欢的壁纸网站,复制网站url,剩下的也大同小异……
上代码:
import requests
#这里用的XPath方法
from lxml import etree
import os
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46'
}
# 找到网站url
url='http://www.facets.la/'
# UA伪装,请求网站数据
response=requests.get(url=url,headers=headers).text
tree=etree.HTML(response)
list_=tree.xpath('//div[@id="thumbs"]/div')
# 创建文件夹
if not os.path.exists('D:\\image\\'):
os.mkdir('D:\\image\\')
for div in list_:
img_src=div.xpath('./div[1]/a/img/@src')[0]
image=requests.get(url=img_src,headers=headers).content
file_name=img_src.split('/')[-1]
# 写入文件
with open('D:\\image\\'+file_name,'wb') as fp:
fp.write(image)
print('over')
print('下载完毕!')