爬虫第二步：解析数据（2）

最新推荐文章于 2024-09-14 19:55:48 发布

六百万修仙派门童

最新推荐文章于 2024-09-14 19:55:48 发布

阅读量89

点赞数

文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_47172104/article/details/111173306

版权

BeautifulSoup模块

BeautifulSoup库是Python中用于解析数据与提取数据的网页解析库

1.安装BeautifulSoup模块

Window系统：命令行窗口输入：pip install BeautifulSoup4
Mac系统：命令行输入：pip3 install BeautifulSoup4

2.使用BeautifulSoup解析数据

使用格式：
bs对象 = BeautifulSoup(要解析的文本内容,‘解析器’）
注意：要解析的内容必须为文本格式
常用解析器推荐：html.parser

import requests
from bs4 import BeautifulSoup

#第一步：获取数据
an = requests.get('www.4399.com')
#第二步：使用BeautifulSoup模块解析数据
soup = BeautifulSoup(an.text,'html.parser')

#打印an.text的数据类型
print(type(an.text))
#<class 'str'>

#打印解析后的数据类型
print(type(soup))
#<class 'bs4.BeautifulSoup'>