lxml.html和lxml.etree将string解析成htmlTree的问题
一开始使用lxml.html.fromstring(),解析后到使用getroot时提示目标对象是一个htmlElement,这和说明文档里写的不一样啊…后来改用lxml.etree.fromstring(),报错解析不了,猜想是字符编码的问题,于是指定parser替换默认parser:parser = etree.HTMLParser(encoding="utf-8")html_tree = lxml.etree.fromstring(data, parser=parser)解析成功,之后再从根节
原创
2020-09-29 10:11:03 ·
435 阅读 ·
0 评论