python爬取图片链接并下载_python 爬虫入门,单页面爬取图片

导入相应模块

import requests

import urllib.request

from lxml import etree

请求头部,模拟浏览器访问

headers = {

'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3423.2 Mobile Safari/537.36'

}

爬取图片的访问地址

使用 requests 请求(访问)网页

HTML = requests.get(url,headers=headers).content

使用 etree 解析整个网页

xp_html = etree.HTML(html)

使用 xpath 定位到需要爬取的图片名称以及连接

imgnames = xp_html.xpath('//div/p/img/@alt')

imgurls = xp_html.xpath('//div/p/img/@src')

循环下载连接中的图片并按照名称保存到 D 盘 XX 文件夹下

for (imgname,imgurl) in zip(imgnames,imgurls):

try:

urllib.request.urlretrieve(imgurl,'D:\XX\%s.jpg' % imgname)

except Exception as e:

print(imgname + ':下载出错,地址为:'+ imgurl)

print('下载完成')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值