BeautifulSoup说明

最新推荐文章于 2024-07-20 09:00:00 发布

嫌水摸鱼

最新推荐文章于 2024-07-20 09:00:00 发布

阅读量255

点赞数 1

文章标签： python 爬虫开发语言 beautifulsoup pycharm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qh075/article/details/127120174

版权

1.说明

是一个高效的网页解析库，可以从HTML或XML文件中提取数据

支持不同的解析器，比如，对HTML解析，对XML解析，对HTML5解析

就是一个非常强大的工具，爬虫利器

一个灵感又方便的网页解析库，处理高效，支持多种解析器

利用它就不用编写正则表达式也能方便的实现网页信息的抓取

2.安装

1.直接在pycharm中的Python packages中输入beautifulsoup4下载

2.找到Python的文件目录，打开cmd，输入python -m pip install beautifulsoup4

同时也要安装lxml库， lxml 是一种使用 Python 编写的解析库，可以迅速、灵活地处理 XML 和 HTML

3.解析库

解析库	使用方法	优势	劣势
Python标准库	BeatifulSoup(markup,'html.parser')	python的内置标准库，执行速度适中，文档容错率强	Python2.7.3or3.2.2前的版本中文容错率差
lxml HTML解析器 lxml XML解析器	BeautifulSoup(markup,'lxml') BeautifulSoup(markup,'xml')	速度快，容错率高速度快，唯一支持XML的解析器	都需要安装C语言库
html5lib	BeautifulSoup(markup,'html5lib')	容错性强，以浏览器方式解析文档，生成HTML5格式的文档	速度慢，不依赖外部扩展

详情讲解请看：http://t.csdn.cn/VzoKN

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BeautifulSoup说明

同时也要安装lxml库， lxml 是一种使用 Python 编写的解析库，可以迅速、灵活地处理 XML 和 HTML。支持不同的解析器，比如，对HTML解析，对XML解析，对HTML5解析。是一个高效的网页解析库，可以从HTML或XML文件中提取数据。利用它就不用编写正则表达式也能方便的实现网页信息的抓取。一个灵感又方便的网页解析库，处理高效，支持多种解析器。就是一个非常强大的工具，爬虫利器。速度快，唯一支持XML的解析器。lxml HTML解析器。lxml XML解析器。速度慢，不依赖外部扩展。
复制链接

扫一扫

嫌水摸鱼 CSDN认证博客专家 CSDN认证企业博客

码龄2年

37: 原创

110万+: 周排名

134万+: 总排名

6万+: 访问

: 等级

436: 积分

862: 粉丝

48: 获赞

3: 评论

229: 收藏

私信

关注

热门文章

最新评论

random的七种用法
＇独自迷惘 and 彷徨’: 谢谢作者大大，但是“符点数”应该改为“浮点数”
random的七种用法
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。