提取网页信息
1.XPath
XPath是XML Path的简称,它是一种用来确定XML文档中某部分位置的语言。
lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,使用前先安装
pip install lxml
官方文档:http://www.w3school.com.cn/xpath/xpath_syntax.asp
XPath使用路径表达式来选取XML文档中的节点或节点集。节点是通过沿着路径(path)或者步(steps)来选取的。
1.XPath
XPath是XML Path的简称,它是一种用来确定XML文档中某部分位置的语言。
lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,使用前先安装
pip install lxml
官方文档:http://www.w3school.com.cn/xpath/xpath_syntax.asp
XPath使用路径表达式来选取XML文档中的节点或节点集。节点是通过沿着路径(path)或者步(steps)来选取的。