python 解析库Beautiful Soup的安装

一、Beautiful Soup的安装

Beautiful Soup是Python的一个HTML或XML的解析库,使用它可以很方便地从网页中提取数据。它的解析器是依赖于lxml库的,所以在此之前,请确保已经成功安装好了lxml库。

本文环境是windows 10 64位+ python3.11, 此处以windows安装为例。

1.1 安装lxml库

lxml库的安装,首先尝试使用pip进行安装:

pip install lxml

如果pip安装报错,比如提示缺少libxml2库等信息,那么可以采用wheel方式安装

20221211174313

采用wheel方式安装,首先需要安装wheel

pip install wheel

20221211193726

然后去官网https://pypi.org/project/lxml/下载lxml对应的的wheel版本, 当前最新版本是lxml 4.9.1, 点击Download files

20221211204339

在列出的files里面,选出和自己的版本相匹配的,例如你的python版本是3.10的,你的机器是windows系统,64位版本,那么就选lxml-4.9.1-cp310-cp310-win_amd64.whl

20221211200756

这里比较坑的一点是,python版本最新的已经是3.11版本了,但是lxml没有对应的官方windows 311版本,只有linux下的311版本。可以选择对python版本降级,比如降到python3.10版。

或者在https://www.lfd.uci.edu/~gohlke/pythonlibs/里,倒是可以找到311版本的windows wheel安装包,可以自行尝试。

20221211204213

安装wheel包的话,到wheel安装包所在目录执行pip 命令即可,或者带上全路径也可以

pip install lxml-4.9.0-cp311-cp311-win_amd64.whl

20221211202526

1.2 安装beautifulsoup4

推荐使用pip来安装,执行下述安装命令

pip install beautifulsoup4

20221211173125

1.3 验证beautifulsoup4能否运行

执行以下代码,能成功输出hello,就说明可以成功使用beautifulsoup4进行解析了。

如果只有beautifulsoup4安装成功,lxml库没有正确安装的话,下面代码不能成功执行。

from bs4 import BeautifulSoup as bs

soup = bs('<p>hello</p>', 'lxml')
print(soup.p.string)

20221211203212

  • 22
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

smart_cat

你的鼓励将是我写作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值