python数据解析之bs4

最新推荐文章于 2024-06-05 09:13:17 发布

弹吉他的羊驼

最新推荐文章于 2024-06-05 09:13:17 发布

阅读量187

点赞数

分类专栏： bs4 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43278562/article/details/115406483

版权

bs4 : python中独特的解析方式，只能应用在python中。
数据解析的原理：

1.标签定位
2.提取标签、标签属性中存储的数据值

bs4数据解析原理：

1.实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中。
2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。

环境安装：

pip install bs4
pip install lxml

如何实例化BeautifulSoup对象：

from bs4 import BeautifulSoup
对象的实例化：
1.将本地的html文档中的数据加载到该对象中

fp = open('./test.html','r',encoding = 'utf-8')
soup = BeautifulSoup(fp,'lxml')

	2.将互联网上获取的页面源码加载到该对象中

page_text = response.text
soup = BeautifulSoup(page_text,'lxml')

提供的用于数据解析的方法和属性：
1.soup.tagName;
2.soup.find()
3.soup.find_all()

最低0.47元/天解锁文章

弹吉他的羊驼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python数据解析之bs4

bs4 : python中独特的解析方式，只能应用在python中。数据解析的原理：1.标签定位2.提取标签、标签属性中存储的数据值bs4数据解析原理：1.实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中。2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取。环境安装：pip install bs4pip install lxml如何实例化BeautifulSoup对象：from bs4 import Beautif
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。