1.2 解析库的使用–XPath:
-
XPath(XML Path Language)是一门在XML文档中查找信息的语言。
-
XPath 可用来在XML文档中对元素和属性进行遍历。
-
XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。
-
官方网址:http://lxml.de 官方文档:http://lxml.de/api/index.html
-
python中如何安装使用XPath:
- ①: 安装 lxml 库。
- ②: from lxml import etree
- ③: Selector = etree.HTML(网页源代码)
- ④: Selector.xpath(一段神奇的符号)
1.2.1. 准备工作:
-
要使用XPath首先要先安装lxml库:
pip install lxml
-
谷歌浏览器配置XPath插件
- 配置参考链接:https://jingyan.baidu.com/article/1e5468f94694ac484861b77d.html
- 如果安装报 包装包无效,解决办法:https://www.cnblogs.com/ljxh/p/11222898.html
1.2.2. XPath选取节点规则