近期由于完成学校作业的需要,博主要学学数据爬虫(好耶ヽ(✿゚▽゚)ノ又是一座高山要攀登)。由于博主是一个刚入门的小白(是真的白哦~~),可能有些的地方描述的不是很清楚或很正确,但是这都不是事,发现问题,记录问题,解决问题才是关键~~
以下进入正题~~
一、问题描述
使用已封装好的BeautifulSoup库获取网页的文章标题时,报错Couldn‘t find a tree builder with the features you requested: lxml. ,报错界面显示问题出现在代码第9行:
soup = BeautifulSoup(content,'lxml')
![](https://img-blog.csdnimg.cn/20211007145615881.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBASW5vY2hpZ29oYW4=,size_20,color_FFFFFF,t_70,g_se,x_16)
![](https://img-blog.csdnimg.cn/20211006211949889.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBASW5vY2hpZ29oYW4=,size_20,color_FFFFFF,t_70,g_se,x_16)
二、解决方法
2.1 安装解析器
报错原因之一(之所以说是之一,是因为报错的类型可能是一样的,但引起报错的原因可能有很多个,可能是缺少某个安装包,可能是代码出错,不能一概而论)可能是你当前所使用的开发环境缺少所需的lxml,那么安装一下就行啦~
博主使用的是Anaconda软件的Spyder写的Python,因此博主要做的是:打开Anaconda prompt,进入所在的开发环境,使用命令 pip install lxml 安装,然后再次运行一下代码,说不定问题就解决了§(* ̄▽ ̄*)§
pip install lxml
2.2 修改代码
哈哈没错,看到这里就知道博主翻车了,问题没有解决~( TロT)σ
再次运行代码还是报错,苍天啊T_T为啥啊T_T
别慌!原因看小标题就知道,错在代码啦~
代码soup = BeautifulSoup(content,'lxml')中 'lxml' 的写法是用于 3.7 版本的,刚刚安装的版本都 4.3 了,所以要将代码里的 'lxml' 改为 'html.parser'
再次运行代码,问题解决~~
所以没有下文啦,完结撒花(✿◕ ‿ ◕ ✿)