Python爬虫精简步骤用BeautifulSoup解析数据

最新推荐文章于 2023-09-05 15:53:23 发布

Lora青蛙

最新推荐文章于 2023-09-05 15:53:23 发布

阅读量1.3k

点赞数 4

分类专栏： Python爬虫文章标签： python 数据挖掘

本文链接：https://blog.csdn.net/LoraRae/article/details/104406630

版权

Python爬虫专栏收录该内容

8 篇文章 0 订阅

订阅专栏

在爬虫中，使用能读懂html的工具，才能提取到想要的数据。
本文介绍BeautifulSoup如何解析数据。
BeautifulSoup不是Python标准库，需要单独安装。
在cmd输入一行代码运行：pip install BeautifulSoup4。（Mac电脑需要输入pip3 install BeautifulSoup4）
在这里插入图片描述
安装成功。
BeautifulSoup解析数据的用法很简单：
bs对象=BeautifulSoup（要解析的文本，‘解析器’）
括号中，要输入两个参数，第0个参数是要被解析的文本，注意，它必须是字符串。
括号中的第1个参数用来标识解析器，要用一个Python内置库：html.parser。（不是唯一的解析器，但是比较简单的）
具体的用法：
根据requests.get()，可以先获取到一个Response对象，并确认获取成功：

import requests #调用requests库
res = requests.get('填入一个URL') 
#获取网页源代码，得到的res是response对象
print(res.status_code) #检查请求是否正确响应
html = res.text #把res的内容以字符串的形式返回
print(html)#打印html

加入BeautifulSoup解析数据：

import requests
from bs4 import BeautifulSoup
#引入BS库
res = requests.get('那个URL') 
html = res.text
soup = BeautifulSoup(html,'html.parser') #把网页解析为BeautifulSoup对象

第2行是引入BeautifulSoup库。
最后一行中的第0个参数，必须是字符串类型；括号中的第1个参数是解析器。
以上就是解析数据的用法。
总结：
使用BeautifulSoup去解析数据：

from bs4 import BeautifulSoup
soup = BeautifulSoup(字符串,'html.parser')

觉得有用的话就给文章点个赞吧~谢谢大家的支持 ~

Lora青蛙

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python爬虫精简步骤 用BeautifulSoup解析数据

Python爬虫精简步骤用BeautifulSoup解析数据