一、xpath解析
xpath解析:最常用且最便捷高效的一种解析方式。通用性很强,不仅可以适用于python,还可以适用于其他编程语言。
二、xpath解析原理
1.xpath解析原理
1.实例化一个etree对象,且需要将被解析的页面源码数据加载到该对象中去。
2.调用etree对象中的xpath方法结合xpath表达式实现标签的定位和内容的捕获。
2.环境的安装
代码如下:
pip install lxml
3.实例化一个etree对象
如何实例化一个etree对象
from lxml import etree
1.将本地的html文件中的源码数据加载到etree对象中:
etree.parse(filePath)
2.将从互联网上获取的源码数据加载到该对象中:
etree.HTML(‘page_text’)
3.xpath(‘xpath表达式’):
下次详细介绍