Python—爬虫之BeautifulSoup模块(解析—提取数据)

本文介绍了如何在Mac和Windows上安装BeautifulSoup模块,并详细讲解了如何利用该模块进行数据解析。重点阐述了find方法用于提取满足条件的第一个数据,find_all方法用于提取所有匹配的数据,以及Tag对象的常用属性和方法。通过实例说明,帮助读者深入理解BeautifulSoup在爬虫中的应用。
摘要由CSDN通过智能技术生成

安装BeautifulSoup模块

Mac电脑:打开终端软件(terminal),输入pip3 install BeautifulSoup4,点击enter;
Windows电脑:打开命令提示符(cmd),输入pip install BeautifulSoup4,点击enter;

解析数据

在这里插入图片描述

#案例说明
import requests    #导入requests库
from bs4 import BeautifulSoup         #引入BS库

#利用requests.get()获取网页数据
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')      
html = res.text          #解析为文本数据
soup = BeautifulSoup(html,'html.parser')        #把网页解析为BeautifulSoup对象
print(type(soup))        #查看类型。结果是一个<class 'bs4.BeautifulSoup'>对象,便于后面提取数据
print(" ")
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值