跟随B站波波老师学爬虫（三）——bf4数据解析

最新推荐文章于 2024-05-18 19:39:35 发布

马小胖测试历险记

最新推荐文章于 2024-05-18 19:39:35 发布

阅读量1.4k

点赞数

分类专栏： Python爬虫学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35779794/article/details/112131687

版权

一、bf4数据解析原理

1、数据解析原理：

-标签定位
-提取解析标签属性存储的数据值

2、bs4数据解析原理：

实例化beautifulSoup对象，并且将页面源码数据加载到该对象中
通过调用beautifulSoup对象中相关的属性或者方法进行标签定位和数据提取

3、实例化的两种方法

将本地html文档加载到该对象中

fp=open('./exclusion_bs4_test.html','r',encoding='utf-8')
soup=BeautifulSoup(fp,'lxml')
print(soup)

将互联网页面数据加载到对象中

page_text=response.text
soup=BeautifulSoup(page_text,'lxml')

4、根据页面元素的方法和属性定位

1）方法

soup.tagName:返回的是文档中第一次出现的tagName的标签
tagName：div...
soup.find('div'):返回的是文档中第一次出现的div
soup.find('div',class_/id/其他属性值='xx')定位class=xx/id=XX的div
soup.findall() 返回符合要求的所有标签
soup.select('某种选择器（id、class,标签选择器)'),返回的是一个列表
层级选择器：soup.sel

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。