BeautifulSoup解析&提取数据

最新推荐文章于 2024-07-02 00:50:11 发布

用户昵称真的存在吗

最新推荐文章于 2024-07-02 00:50:11 发布

阅读量399

点赞数

分类专栏： python学习文章标签： python

本文链接：https://blog.csdn.net/weixin_42784631/article/details/114298545

版权

python学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

BeautifulSoup解析数据

在这里插入图片描述

import requests
# 引入BS库，下面的bs4就是beautifulsoup4
from bs4 import BeautifulSoup
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
# 把网页解析为BeautifulSoup对象
soup = BeautifulSoup(res.text,'html.parser')

BeautifulSoup提取数据

find() 与 find_all()
在这里插入图片描述
两个要点：

首先，请看举例中括号里的class_，这里有一个下划线，是为了和python语法中的类 class区分，避免程序冲突。当然，除了用class属性去匹配，还可以使用其它属性，比如style属性等。

其次，括号中的参数：标签和属性可以任选其一，也可以两个一起使用，这取决于我们要在网页中提取的内容。

如果只用其中一个参数就可以准确定位的话，就只用一个参数检索。如果需要标签和属性同时满足的情况下才能准确定位到我们想找的内容，那就两个参数一起使用。

Tag对象

在这里插入图片描述

用户昵称真的存在吗

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BeautifulSoup解析&提取数据

BeautifulSoup解析数据import requests# 引入BS库，下面的bs4就是beautifulsoup4from bs4 import BeautifulSoupres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')# 把网页解析为BeautifulSoup对象soup = BeautifulSoup(res.text
复制链接

扫一扫