Python爬虫学习笔记之BeautifulSoup入门

最新推荐文章于 2021-08-30 15:30:37 发布

LitaVadaski

最新推荐文章于 2021-08-30 15:30:37 发布

阅读量774

点赞数

本文链接：https://blog.csdn.net/LitaVadaski/article/details/79283521

版权

本文是关于Python爬虫中BeautifulSoup库的学习笔记，介绍了BeautifulSoup的安装、导入、创建对象、解析器选择、遍历HTML节点的方法，包括下行、上行和平行遍历，以及prettify方法的使用。此外，还提及了BeautifulSoup在Python3中的编码处理和基于bs4的HTML文档查找方法。

摘要由CSDN通过智能技术生成

BeautifulSoup库学习总结：

简介：

BeautifulSoup是用来解析html/xml的工具，我们在爬虫保存下我们需要的html文档后需要用它来进行文档的解析与信息提取工作。

安装：

在管理员权限下打开cmd，输入pip install BeautifulSoup4

导入：

from bs4 import BeautifulSoup

创建BeautifulSoup对象：

Soup = BeautifulSoup(“要解析的页面”,”解析器”)

Demo：soup = BeautifulSoup(r.text,”html.parser”

输出：

print(soup.prettify())

BeautifulSoup库解析器：

解析器	使用方法	条件
bs4的html解析器	BeautifulSoup(mk,’htmlparser’)	安装bs4库
lxml的html解析器	BeautifulSoup(mk,’lxml’)	安装lxml库
lxml的xml解析器	BeautifulSoup(mk,’xml’)	安装lxml库
Html5lib的解析器	BeautifulSoup(mk,’html5lib’)	安装html5lib库

BeautifulSoup类基本元素：

最低0.47元/天解锁文章

LitaVadaski

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫学习笔记之BeautifulSoup入门

BeautifulSoup库学习总结：简介：BeautifulSoup是用来解析html/xml的工具，我们在爬虫保存下我们需要的html文档后需要用它来进行文档的解析与信息提取工作。安装：在管理员权限下打开cmd，输入pip install BeautifulSoup4导入：from bs4 import BeautifulSoup创建BeautifulSoup对象：Soup = Beautif...
复制链接

扫一扫

专栏目录