bs4进行数据解析

最新推荐文章于 2024-03-10 20:07:04 发布

qq_51478930

最新推荐文章于 2024-03-10 20:07:04 发布

阅读量114

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_51478930/article/details/119648348

版权

笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本文详细介绍了数据解析的基本原理，特别是使用BeautifulSoup库来处理HTML文档。首先讲解了标签定位和数据值提取，接着通过实例展示了如何创建BeautifulSoup对象，无论是从网页抓取数据还是读取本地HTML文件。此外，还演示了如何使用find_all方法查找特定类别的标签。内容适合于对网页抓取和数据解析感兴趣的前端开发者和信息爬虫工程师。

摘要由CSDN通过智能技术生成

一，数据解析原理
1，标签定位
2，提取标签，标签属性中存储的数据值

二，bs4数据解析原理
1，实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中
2，通过调用BeautifulSoup对象中相关属性或者方法进行标签定位和数据提取

三，如何实例化BeautifulSoup对象

from bs4 import BeautifulSoup

#从互联网中将数据加载到该对象中
response = requests.get(url=url, headers=headers)
page_text = response.text
soup=BeautifulSoup(page_text,'html.parser')       
#html解析器：html.parser ，前一个参数则是要解析的内容
#将本地的html文档中的数据记载到该对象中
fp = open('**.html', 'r', encounding='utf-8')
soup  = BeautifulSoup(fp,'lxml')

1,对象实例化：
a—将本地的html文档中的数据加载到该对象中
b—将互联网上获取的页面源码加载到该对象中

2，提供的用于数据解析的方法和属性：
soup.+以下的方法和属性
在这里插入图片描述

div_list=soup.find_all(class_='content__list--item')
#返回所有以(class_='content__list--item')开始的标签，并形成列表

qq_51478930

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
bs4进行数据解析

一，数据解析原理1，标签定位2，提取标签，标签属性中存储的数据值二，bs4数据解析原理1，实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中2，通过调用BeautifulSoup对象中相关属性或者方法进行标签定位和数据提取三，如何实例化BeautifulSoup对象from bs4 import BeautifulSoup#从互联网中将数据加载到该对象中response = requests.get(url=url, headers=headers)page_t
复制链接

扫一扫

专栏目录