bs4库的安装与使用

最新推荐文章于 2024-08-08 15:42:55 发布

OathkeePer2x

最新推荐文章于 2024-08-08 15:42:55 发布

阅读量1.6w

点赞数 5

分类专栏：网络爬虫学习文章标签：爬虫 bs4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OathkeePer2x/article/details/78546109

版权

网络爬虫学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1、bs4库的安装

win平台上bs库的安装：以“管理员身份运行cmd”

执行 pip install beautifulsoup4来安装bs4库

2、bs4库的引用

主要使用BeautifulSoup 类：

from bs4 import BeautifulSoup:

或者直接 import bs4

BeautifulSoup对应一个HTML/XML的全部内容，会以标签树的形式存储

soup = BeautifulSoup('<html>data</html>','html.parser')

bs4库的prettify()方法：

为html文本及其内容增加‘\n’，使用方法为<tag>.prettify()

Tag是标签，最基本的信息组织单元

Name是标签的名字 <Tag>.name

Attributes是标签的属性 <Tag>.attrs

NavigableString是标签内的非属性字符串 <Tag>.string

Comment是标签内字符串的注释部分

标签树的下行遍历：

.contents 子节点的列表，将<tag>所有儿子节点存入列表

.children 子节点的迭代类型，与.contents类似，用于循环遍历儿子节点

.descendants 子孙节点的迭代类型，包含所有子孙节点，用于循环遍历

标签树的上行遍历:

.parent 节点的父亲标签

.parents 节点先辈标签的迭代类型，用于循环遍历先辈节点

标签树的平行遍历:

.next_sibling 返回按照HTML文本顺序的下一个平行节点标签

.previous_sibling 返回按照HTML文本顺序的上一个平行节点标签

.next_siblings 迭代类型，返回按照HTML文本顺序的后续所有平行节点标签

.previous_siblings 迭代类型，返回按照HTML文本顺序的前续所有平行节点标签

<>.find_all方法：

<>.find_all(name,attrs,recursive, string, **kwargs)
返回一个列表类型，存储查找的结果

<tag>(..) 等价于<tag>.find_all(..)

soup(..) 等价于soup.find_all(..)

关注

5
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

OathkeePer2x CSDN认证博客专家 CSDN认证企业博客

码龄8年

32: 原创

41万+: 周排名

181万+: 总排名

5万+: 访问

: 等级

669: 积分

12: 粉丝

23: 获赞

11: 评论

86: 收藏

私信

关注

热门文章

分类专栏

OSG 1篇
实验室打杂 1篇
CG 1篇
opencv学习 2篇
ArcEngine 1篇
Python 4篇
JAVA学习 15篇
网络爬虫学习 9篇

最新评论

【三维GIS】Google Map/Google Earth三维模型提取
M1r4n: 【三维GIS】Google Map/Google Earth三维模型提取值得学习，非常受益，期待OathkeePer2x的下一篇文章
【OSG】读取osgb倾斜数据
mylove10086: 在源码中写示例读取osbg为什么会出现 Error reading file Tile_+002_+002_L15_0.osgb: read error (Could not find plugin to read objects from file "Tile_+002_+002_L15_0.osgb".)
【OPENCV】opencv+python+anaconda+vscode环境配置
m0_65795563: 为什么在code File- > Preferences -> Settings：搜索框中搜python.pythonpath什么也没有啊？
【三维GIS】Google Map/Google Earth三维模型提取
嗨，朋友: RDC文件导入Blender后，细看模型的话是两层重叠了，面数和体积会增加一倍，这个问题有好的解决方法了吗？
【三维GIS】Google Map/Google Earth三维模型提取
miomio2011: 超级好用

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。