python爬虫学习26

亦瑕

已于 2022-04-05 22:11:34 修改

阅读量706

点赞数 1

文章标签： python 爬虫学习

于 2022-04-05 22:10:40 首次发布

本文链接：https://blog.csdn.net/szshiquan/article/details/123978598

版权

这篇博客主要介绍了XPath在Python爬虫中的应用，包括XPath工具的安装、常用规则，通过实例演示如何选取HTML节点，展示了选取所有节点和匹配特定节点的方法。

摘要由CSDN通过智能技术生成

python爬虫学习26

五、Xpath 的使用

Xpath，全称 XML path Language（XML路径语言），是一种用来在XML文本中查找信息的语言。我们既然介绍到了他，自然，他同样可以对html的文档适用。

5.1 Xpath 工具的安装

这里我们使用 lxml库：先把武器装备上

pip3 install lmxl

5.2 Xpath常用规则

在这里插入图片描述

例如：

//title[@lang='eng']

意为选取所有名称为title的属性值为eng的节点

5.3 实例引入

还是之前正则那里用到的一段html：

html = """
<div class="nav">
			<ul>
				<li><a href="https://www.qbiqu.com/">首页</a></li>
                <li><a href="/modules/article/bookcase.php">我的书架</a></li>
				<li><a href="/xuanhuanxiaoshuo/">玄幻小说</a></li>
				<li><a href="/xiuzhenxiaoshuo/">修真小说</a></li>
				<li><a href="/dushixiaoshuo/">都市小说</a></li>
				<li><a href="/chuanyuexiaoshuo/">穿越小说</a></li>
				<li><a href="/wangyouxiaoshuo/">网游小说</a></li>
				<li><a href="/kehuanxiaoshuo/">科幻小说</a&g

最低0.47元/天解锁文章

亦瑕

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
python爬虫学习26

python爬虫学习26目录python爬虫学习26五、Xpath 的使用5.1 Xpath 工具的安装5.2 Xpath常用规则5.3 实例引入5.4 所有节点本来呢，想给大家整个实战来着，结果昨天弄了一晚上发现好多网站都弄了反爬，就没弄成，所以还是继续深入学习吧，就不整那些虚的了先。。。废话不多说，进入正题。之前呢，我们一同学习了最基础的爬虫，也学习了正则表达式，但是大家有没有一种感觉，就是匹配网页html文本写的正则表达式还是比较麻烦，比较不方便？唉~这时候这种感觉，就会促使我们进一步提高技
复制链接

扫一扫