一、安装第三方爬虫库BeautifulSoup
二、安装lxml类库
(1)首先,安装wheel。
先进入python安装目录下的scripts目录 cd xxxxxxxx
pip3 install wheel
(2)查看自己的python版本的支持情况
从网站下载对应版本支持的lxml的whl文件,网址为:
【点击打开链接】https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
下载完成后,在cmd中
pip install 绝对路径\文件名.whl
软件安装至此完毕。
二、用BeautifulSoup和lxml解析库解析网站
我用的是本地html文件进行的实验: