本篇简单介绍 xpath 在python爬虫方面的使用,想要具体学习 xpath 可以到 w3school 查看 xpath 文档
xpath文档:http://www.w3school.com.cn/xpath/index.asp
Python爬虫教程-21-xpath
什么是 XPath?
XPath 使用路径表达式在 XML 文档中进行导航
XPath 包含一个标准函数库
XPath 是 XSLT 中的主要元素
XPath 是一个 W3C 标准
用途:它是一种用来确定XML文档中某部分位置的语言
XPath开发工具:
开源的XPath表达式工具:XMLQuire
Chrome 插件:XPath Helper
FIrefox插件:XPath CHecker
XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言
在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点
<?xml version="1.0" encoding="UTF-8" ?>
Everyday ItalianGidada De
2018
23
Python is PythonFood War
2008
83
RunningKlaus Kuka
2010
43
XPath 路径表达式
XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
常用路径表达式:
实例:
谓语(Predicates)
谓语用来查找某个特定的节点或者包含某个指定的值的节点
谓语被嵌在方括号中
实例:
在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
选取未知节点
XPath 通配符可用来选取未知的 XML 元素
实例:
选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径
实例:
- 图片来自w3school http://www.w3school.com.cn/xpath/xpath_syntax.asp
- 本笔记不允许任何个人和组织转载