爬虫--爬取单张图片

本文介绍了如何新建Python项目,并通过安装requests和lxml库来准备爬虫环境。接着,创建images目录用于存储图片,然后编写Python脚本,模拟请求网页并解析HTML,定位到图片元素。通过XPath选择器提取图片的URL和标题,最后下载并保存图片到本地。这是一个基础的Python爬虫实践案例,适合初学者入门。
摘要由CSDN通过智能技术生成

一.新建python项目

二.安装所需库

1.在终端中输入pip install requests

2.安装lxml

 三.创建images目录,存放图片

 

四.创建一个python文件,爬取单张图片

 

五.爬取图片

(1).导入所需库

(2).定义网页

 

 (3).定义headers

  (4).模拟发送请求,获取网页内容

 

 

六.规则提取数据-待爬取图片标题和网址

 分析网页:包含图像标签的<a>的id属性值为img

  1.利用xpath搜索id属性值img的<a>标签

 2. 继续在a_res基础上搜索图像标签

 

 3.在img_res基础上搜索网址和标题

 

 七.下载爬取的图片并保存到本地

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值