XPath (XML Path) 与正则表达式 同:提取HTML源代码信息 异:在同为提取复杂内容的情况下,XPath提取效率更高。 使用建议:正则表达式->提取简单内容;XPath->提取复杂信息 lxml 使用XPath,需要安装第三方库:lxml 基本语法 import lxml.html selector = lxml.html.fromstring('网页源代码') info = selector.xpath('一段XPath语句') Tips:可使用浏览器辅助构建XPath