python爬取静态网页中的图片案例

最新推荐文章于 2023-10-22 17:27:25 发布

长江中下游最靓的仔

最新推荐文章于 2023-10-22 17:27:25 发布

阅读量312

点赞数

文章标签： python 爬虫数据挖掘

本文链接：https://blog.csdn.net/weixin_45619473/article/details/124943222

版权

本文介绍了一个Python爬虫案例，专注于从静态网页中抓取图片。讲解了如何使用正则表达式解析图片链接，同时提出了在爬取过程中遇到的问题，如乱码、获取多张图片、解析方式拓展到BS4和XPath，以及如何提高爬虫效率和实现翻页功能。

摘要由CSDN通过智能技术生成

前言

聚焦爬虫的意思是爬取页面中指定的页面内容：数据解析包括

正则解析
bs4解析（python独有）
xpath解析

一、正则解析的案例

我们爬取的是一家图片网站，网址是：
https://desk.zol.com.cn/fengjing/1.html

import requests
import os
import re
if __name__ == "__main__":
    if not os.path.exists('./picture_libs'):#如果路径不存在，则用mkdir创建一个单级目录
        os.mkdir('./picture_libs')
        #UA伪装
    headers = {
   'User-Agent': 'Mozilla/5.0 (MSIE 10.0; Windows NT 6.1; Trident/5.0)'

最低0.47元/天解锁文章

长江中下游最靓的仔

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python爬取静态网页中的图片案例

文章目录前言一、正则解析的案例二、问题三、仅供学习使用前言聚焦爬虫的意思是爬取页面中指定的页面内容：数据解析包括正则解析bs4解析（python独有）xpath解析一、正则解析的案例我们爬取的是一家图片网站，网址是：https://desk.zol.com.cn/fengjing/1.htmlimport requestsimport osimport reif __name__ == "__main__": if not os.path.exists('./pictur
复制链接

扫一扫