python3 安装_Python3 安装Beautifulsoup

Beautifulsoup介绍

HTML 文档本身是结构化的文本,有一定的规则,通过它的结构可以简化信息提取。于是,就有了lxml、pyquery、BeautifulSoup等网页信息提取库。一般我们会用这些库来提取网页信息。其中,lxml 有很高的解析效率,支持 xPath 语法(一种可以在 HTML 中查找信息的规则语法);pyquery 得名于 jQuery(知名的前端 js 库),可以用类似 jQuery 的语法解析网页。

bs 最大的特点我觉得是简单易用,不像正则和 xPath 需要刻意去记住很多特定语法,尽管那样会效率更高更直接。对大多数 python 使用者来说,好用会比高效更重要。这也是我自己使用并推荐 bs 的主要原因。

安装Python库

需要注意的是,当你在Python3上进行安装的时候,如果仅写beautifulsoup会报错,该库已经更新到4.x版本,所以使用如下命令进行安装即可。

text

14 复制

1sudo pip3 install beautifulsoup4

注意事项

如果尝试安装未指定版本号的旧版本库,将会报出以下错误:

text

13 复制

1

2

3

4

5

6

7

8

9

10

11

12ERROR: Command errored out with exit status 1:

command: /usr/bin/python3 -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py'"'"'; __file__='"'"'/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base /tmp/pip-install-k2bz1jqv/beautifulsoup/pip-egg-info

cwd: /tmp/pip-install-k2bz1jqv/beautifulsoup/

Complete output (6 lines):

Traceback (most recent call last):

File "", line 1, in

File "/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py", line 3

"You're trying to run a very old release of Beautiful Soup under Python 3. This will not work."<>"Please use Beautiful Soup 4, available through the pip package 'beautifulsoup4'."

^

SyntaxError: invalid syntax

----------------------------------------

ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值