爬虫-xpath-4k图片解析下载

最新推荐文章于 2022-05-28 08:18:22 发布

薄荷杂学

最新推荐文章于 2022-05-28 08:18:22 发布

阅读量179

点赞数

分类专栏： # 爬虫实战文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_43825323/article/details/116094618

版权

文章目录

1）需求分析
2）基本思路
3）程序
4）运行效果

1）需求分析

网站：http://www.netbian.com/meinv/
爬取下图所示图片，并保存到本地。

在这里插入图片描述

2）基本思路

首先使用requests模块获取网页数据；
其次，利用xpath解析数据，获取li列表，‘//div[@class=“list”]/ul/li’
然后，循环，提取a标签里面的img标签的src，即可获得图片
最后，将数据保存到本地文件；
在这里插入图片描述

3）程序

（1）导包

import requests
from lxml import etree

（2）使用requests发起响应，获得网页数据

def get_one_page(url):
    """
    获取某一页的数据
    """
    try:
        headers = {
   
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.54'

最低0.47元/天解锁文章

薄荷杂学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫-xpath-4k图片解析下载

文章目录1）需求分析2）基本思路3）程序（1）导包（2）使用requests发起响应，获得网页数据（3）利用XPath解析数据并将其保存到本地运行程序4）运行效果1）需求分析网站：http://www.netbian.com/meinv/爬取下图所示图片，并保存到本地。2）基本思路首先使用requests模块获取网页数据；其次，利用xpath解析数据，获取li列表，‘//div[@class=“list”]/ul/li’然后，循环，提取a标签里面的img标签的src，即可获得图片最后，将数
复制链接

扫一扫