Python中安装Beautiful Soup库及其相关解析器的方法2-1

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库。它能够实现惯用的文档导航,查找,修改文档的方式。Beautiful Soup会帮你节省数小时甚至数天的工作时间。Beautiful Soup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,这些第三方的解析器包括“lxml”和“html5lib”等。

在IDLE和PyCharm中使用Beautiful Soup时,需要安装相应的库及第三方解析器。

1 IDLE中使用BeautifulSoup库及其相关解析器

1.1 IDLE中的报错信息

在IDLE中使用如下代码导入BeautifulSoup时会报错,如图1所示。

图1 导入BeautifulSoup时的报错信息

以上报错信息是“没有找到相关模块错误信息:没有找到名为bs4的模块”。

1.2 在cmd中查看安装的模块

点击“Win”+“R”键,在弹出的“运行”界面中输入“cmd”,如图2所示。

图2 “运行”界面中输入“cmd”

点击“确定”后,进入cmd界面。在cmd中输入“pip list”并点击回车按键,查看当前安装的模块,如图3所示。

图3 查看当前安装的模块

从图3中可以看出,当前并没有安装BeautifulSoup模块。

1.3 通过cmd安装BeautifulSoup模块

在cmd中输入“pip install beautifulsoup4”,开始安装BeautifulSoup模块,如图4所示。

图4 安装BeautifulSoup模块

从图4中可以看出,BeautifulSoup模块安装成功。此时再次输入“pip list”查看安装的模块,如图5所示。

图5 查看安装的模块

从图5中可以看到,BeautifulSoup模块已经安装成功。在IDLE中再次导入BeautifulSoup模块,此时代码能够成功运行,如图6所示。

图6 代码能够成功运行

1.4 通过cmd安装lxml解析器

在cmd中输入“pip install lxml”,开始安装lxml解析器,如图6所示。

图7 安装lxml解析器

1.5 通过cmd安装html5lib解析器

在cmd中输入“pip install html5lib”,开始安装html5lib解析器,如图8所示。

图8 安装html5lib解析器

在cmd中输入“pip list”,可以看到,lxml解析器和html5lib解析器已经安装成功,如图9所示。

图9 lxml和html5lib安装成功

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值