(一)安装xpath
1.下载xpath插件
链接:https://pan.baidu.com/s/1E1WbNJktM1m9JmgGKCh_mw?pwd=1005
提取码:1005
2.打开谷歌浏览器,右上角三个点那里点击扩展程序-管理扩展程序
3.打开右上角开发者模式,把下载好的插件直接拉进来。此时会提示错误。这时需要改掉xpath后缀,将插件后缀改成zip,再次拖入即可。
4.关闭浏览器再打开任意一个网页,点击快捷键ctrl+shift+x页面上方会出现黑色长框,即表示xpath安装成功。
(二)在pycharm中下载lxml库
点击文件-设置- python解释器-左上角+号键-搜索lxml-安装-即可安装成功
(三)xpath解析本地文件用etree.prase();解析服务器响应文件etree.HTML()
注:在高版本的pychrm中,语句from lxml import etree可能会报错。
可以直接写成
from lxml import html
etree=html.etree即可。