python beautifulsoup_Python3 安装Beautifulsoup

Python3 安装Beautifulsoup

admin • 2019 年 11 月 22 日

[title]Beautifulsoup介绍[/title]

HTML 文档本身是结构化的文本,有一定的规则,通过它的结构可以简化信息提取。于是,就有了lxml、pyquery、BeautifulSoup等网页信息提取库。一般我们会用这些库来提取网页信息。其中,lxml 有很高的解析效率,支持 xPath 语法(一种可以在 HTML 中查找信息的规则语法);pyquery 得名于 jQuery(知名的前端 js 库),可以用类似 jQuery 的语法解析网页。

bs 最大的特点我觉得是简单易用,不像正则和 xPath 需要刻意去记住很多特定语法,尽管那样会效率更高更直接。对大多数 python 使用者来说,好用会比高效更重要。这也是我自己使用并推荐 bs 的主要原因。

[title]安装Python库[/title]

需要注意的是,当你在Python3上进行安装的时候,如果仅写beautifulsoup会报错,该库已经更新到4.x版本,所以使用如下命令进行安装即可。

sudo pip3 install beautifulsoup4

[title]注意事项[/title]

如果尝试安装未指定版本号的旧版本库,将会报出以下错误:

[cc] ERROR: Command errored out with exit status 1:

command: /usr/bin/python3 -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py'"'"'; __file__='"'"'/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base /tmp/pip-install-k2bz1jqv/beautifulsoup/pip-egg-info

cwd: /tmp/pip-install-k2bz1jqv/beautifulsoup/

Complete output (6 lines):

Traceback (most recent call last):

File "", line 1, in File "/tmp/pip-install-k2bz1jqv/beautifulsoup/setup.py", line 3

"You're trying to run a very old release of Beautiful Soup under Python 3. This will not work."<>"Please use Beautiful Soup 4, available through the pip package 'beautifulsoup4'."

^

SyntaxError: invalid syntax

----------------------------------------

ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.[/cc]

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值