环境:python-3.8.6+lxml-4.6.2
出错原因:python 3.5之后的lxml中无法直接 from lxml import etree 引入etree
一开始尝试了网上的办法发现都比较麻烦,因为去找老版本的lxml或者换python版本太麻烦了,虽然新版本无法直接引入,但是它只不过是换了一个办法引出etree模块而已!
正确的引用方法是:
from lxml import html
etree = html.etree
text=```xxx```//测试的html文本
htmlDiv = etree.HTML(text)
title = htmlDiv.xpath("//meta[1]/@content")
print(title)