使用chrome_Xpath_v2.0.2
- 打开百度首页, Shift + Ctrl +x 激活
- 当前页进入需要使用chrome_Xpath的页面
XPath 语法
1.路径查询
- / 表示 当前 文档的 一级 子元素,HTML中从‘< html >开始的
- // 查找 所有的子孙节点,不考虑层级关系
- ./ 当前路径下的a元素的文本内容
- 父级下的span的文本内容
- *通配符
- /* 任意一个子节点
- //* 任意子孙节点(该HTML下有952个子孙节点)
2.谓词查询
- //div[@id] 查询都有带id属性的div标签
- //div[@id=“maincontent”] 查询id属性为maincontent的div标签
3.属性查询
- //@class 查询所有标签的class属性
4.模糊查询
- //div[contains(@id, “he”)] 查询所有id属性中包含he的div标签
5.内容查询
- //div/h1/text() 查找所有div标签下的直接子节点h1的内容
6.逻辑运算
XPath 使用
1.安装
pip install lxml
2.code:
con =