html页面解析类:lxml(用的是etree下面的xpath)
html=etree.HTML(content)#-*-coding:UTF-8-*-from lxml import etree #xpath是etree内的模块import sysreload(sys)sys.setdefaultencoding('utf8')file=open('a.html','r')content=file.read()html=etree.HTML(content) #将html内容转换为树状结构的可访问内容file.close()####开始读取h
原创
2021-01-25 17:47:11 ·
322 阅读 ·
0 评论