BeautifulSoup 用法总结

最新推荐文章于 2024-07-26 17:15:21 发布

Ayhan_huang

最新推荐文章于 2024-07-26 17:15:21 发布

阅读量1.1k

点赞数

分类专栏： python 文章标签： html解析器 python

本文链接：https://blog.csdn.net/Ayhan_huang/article/details/78488705

版权

BeautifulSoup是一个Python库，用于从HTML和XML文件中提取数据。本文将介绍其安装、解析器选择、标签选择器、常用属性和方法，如find_all、CSS选择器和内容提取等，帮助你高效解析网页。

摘要由CSDN通过智能技术生成

介绍

BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库

pip install beautifulsoup4

Beautiful Soup支持Python标准库中的HTML解析器（’html.parser’）,还支持一些第三方的解析器，比如lxml，推荐用后者，纯C实现的，速度更快：

pip install lxml

from bs4 import BeautifulSoup

soup=BeautifulSoup(html_doc,'lxml')
soup=soup.prettify() #容错处理===>自动补全代码

一个html是一个对象，对象可以嵌套对象；每个soup对象下的每一个标签，也都是对象。

关注

专栏目录