简介
XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。
安装
pip install lxml
本文示例的html代码
<div>
<div>
<ul>
<li class="item-0">
<a href="link1.html">first item</a>
</li>
<li class="item-1">
<a href="link2.html">second item</a>
</li>
</ul>
</div>
<div id="111">
<div class="item-1">
<a href="www.qq.com">qq.com</a>
<p>this is p label</p>
<ul>
<li class="item-2">
<a href="link1.html">first item1</a>
</li>
<li class="item-3">
<a href="link2.html">second item2</a>
</li>
</ul>
</div>
<a href="www.baidu.com"></