python beautifulsoup库下载_python BeautifulSoup库的安装与使用

最新推荐文章于 2024-06-19 10:36:05 发布

浊池

最新推荐文章于 2024-06-19 10:36:05 发布

阅读量732

点赞数

文章标签： python beautifulsoup库下载

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42676678/article/details/113479179

版权

本文介绍了Python的BeautifulSoup库，用于解析HTML和XML数据。讲解了BeautifulSoup的安装，通过pip3安装beautifulsoup4，并展示了如何使用BeautifulSoup进行网页内容的提取，包括prettify()、get_text()等方法，以及对Tag对象、NavigableString、Comment的处理。此外，还介绍了find_all()和find()等搜索功能，以及节点操作如子节点、父节点和兄弟节点的概念。

摘要由CSDN通过智能技术生成

1.BeautifulSoup简介

BeautifulSoup4和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。

BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器，如果我们不安装它，则 Python 会使用 Python默认的解析器，lxml 解析器更加强大，速度更快，推荐使用lxml 解析器。

Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。你不需要考虑编码方式，除非文档没有指定一个编码方式，这时，Beautiful Soup就不能自动识别编码方式了。然后，你仅仅需要说明一下原始编码方式就可以了。

2.BeautifulSoup的安装

首先我们需要安装一个BeautifulSoup库。我安装的版本是python3。所以就可以直接在cmd下用pip3命令进行安装。

命令：

pip3 install beautifulsoup4

在安装好BeautifulSoup后，我们可以通过导入该库来判断是否安装成功。

命令：

>>> from bs4 import BeautifulSoup

回车后不报错，这说明我们已经将其安装成功。

3.BeautifulSoup常用功能

# beautiful soup 网页中提取信息的python库

# BeautifulSoup 对象表示的是一个文档的全部内容

# prettify() 按照标准的缩进格式的结构输出

# get_text() 会将HTML文档中的所有标

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。