Python爬虫应用实战案例-xpath正则表达式使用方法，爬取精美壁纸

最新推荐文章于 2024-03-20 17:15:03 发布

文宇肃然

最新推荐文章于 2024-03-20 17:15:03 发布

阅读量1.3k

点赞数

分类专栏： python快速学习实战应用系列课程文章标签：正则表达式 python 爬虫

本文链接：https://blog.csdn.net/wenyusuran/article/details/120505083

版权

139 篇文章 234 订阅 ¥29.90 ¥99.00

订阅专栏

本文介绍了如何使用XPath在Python中解析HTML，以爬取精美壁纸为例，详细讲解了XPath的基本规则，包括获取所有节点、指定节点、子节点、父节点、属性匹配等。并提供了实战案例，演示了如何获取和保存图片链接，实现爬虫功能。

摘要由CSDN通过智能技术生成

使用XPath

XPath，全称XML Path Language，即XML路径语言，它是在XML语言中查找信息的语言。它最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。

在上一篇文章中讲述了正则表达式的使用方法，正则表达式的难度还是比较大的，如果不花足够多的时间去做的话还是比较难的，所以今天就来分享比正则简单的内容，方便大家接下来的学习。

XPath的规则是非常丰富的，本篇文章无法一次性全部概括，只能为大家介绍几个常用的规则。

在使用之前得先安装好lxml这个库，如果没有安装请参考下面的安装方式。

pip install lxml

了解本专栏

关注

专栏目录