节点
节点选择工具
- chrome插件XPath-Helper
- Firefox插件XPath Checker
属性节点:xx=yy
XML:可拓展标记语言
html:超文本标记语言
lxml:是Python当中的一个第三方的库,包含了将html转成xml对象和对对象执行xpath的功能。
xpath
(XML Path Language )是一种XML的查询语言,能在XML树状结构中寻找节点 ,在节点、文档中通过元素和属性进行导航
表达式 | 描述 |
nodename | 选取此节点的所有子节点 |
/ | 从根节点选取 |
// | 从匹配选择的当前节点选择文档中的节点,不考虑位置 |
. | 选取当前前节点 |
.. | 选取当前节点的父节点 |
@ | 选取属性,来定位标签 |
[ ] | 谓语,用来查找某个特定的节点或者包含某个特定值的节点,谓语被镶嵌到方括号中 |