Python—爬虫之BeautifulSoup模块(解析—提取数据)

最新推荐文章于 2024-07-09 17:35:27 发布

猫看见偶像说

最新推荐文章于 2024-07-09 17:35:27 发布

阅读量6.4k

点赞数 3

分类专栏： Python—爬虫文章标签： BeautifulSoup模块解析数据 find & find_all提取数据 Tag常用的属性和方法案例说明

本文链接：https://blog.csdn.net/weixin_44755148/article/details/93747148

版权

本文介绍了如何在Mac和Windows上安装BeautifulSoup模块，并详细讲解了如何利用该模块进行数据解析。重点阐述了find方法用于提取满足条件的第一个数据，find_all方法用于提取所有匹配的数据，以及Tag对象的常用属性和方法。通过实例说明，帮助读者深入理解BeautifulSoup在爬虫中的应用。

摘要由CSDN通过智能技术生成

Python—爬虫之BeautifulSoup模块（解析—提取数据）

安装BeautifulSoup模块

Mac电脑：打开终端软件（terminal），输入pip3 install BeautifulSoup4，点击enter；
Windows电脑：打开命令提示符（cmd），输入pip install BeautifulSoup4，点击enter；

解析数据

在这里插入图片描述

#案例说明
import requests    #导入requests库
from bs4 import BeautifulSoup         #引入BS库

#利用requests.get()获取网页数据
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')      
html = res.text          #解析为文本数据
soup = BeautifulSoup(html,'html.parser')        #把网页解析为BeautifulSoup对象
print(type(soup))        #查看类型。结果是一个<class 'bs4.BeautifulSoup'>对象，便于后面提取数据
print(" ")