学习xpath数据解析
安装的是最新版本的annoconda, 内部集成lxml版本4.6
pycharm会提示无法找到lxml.etree
调用也会出现错误XMLSyntaxError
解决方案:
首先在https://www.lfd.uci.edu/~gohlke/pythonlibs/中选择相应lxml的版本
在相应的cd目录下
pip install lxml-4.8.0-cp39-cp39-win_amd64.whl
成功安装
注意!
安装完毕后直接调用会报错
据说是解析器无法解析不规范的html文件, 自己创建一个解析器就好了
增加parser参数
parser = etree.HTMLParser(encoding="utf-8")
成功解决问题!