1.xpath是什么?
-
xpath就是一种可以根据地址找人的技术 确定的路径
-
xpath是在xml下查找的技术,如果我们需要查找html文件的内容,就需要lxml库来进行转化
-
xpath(XML Path Language) 可以在树状结构中寻找结点 可以通过元素和属性进行导
2.xpath有什么作用?
- 解析网页 提取数据
- 我们对不同的网页采取不同的方法,也可能会用到正则来提取都是解析网页的方法
2.html,xml,lxml的区别
html 超文本标记语言
xml 可扩展标记语言
lxml 是一个Python第三方的库 它可以把这个html文本转换成xml对象(element对象) 使用xpath语法进行导航了
- 用来把html文件转化成xml对象 html_element = etree.HTML(html)
3.xpath-helper 安装
- 网盘链接 https://pan.baidu.com/s/1B2D_zJh7v_pWVh26n1AOzg
- 提取码 1213
1 双击解压文件
2 保存解压好的文件
3 点击 … 选择更多工具 --> 扩展程序
注意 : 开发者选择是开启状态
4 点击 加载已解压的扩展程序 找到刚才解压的文件夹 点击 确定 即可
- 快捷键 ctrl + shift + x 如果有的软件快捷键和这个插件冲突了 要么把这个软件关掉 要么修改这个软件的快捷键