#python 爬虫 #BeautifulSoup如何分别提取多个span标签的值

最新推荐文章于 2023-08-09 18:06:00 发布

神经森森是我鸭

最新推荐文章于 2023-08-09 18:06:00 发布

阅读量1.3w

点赞数 4

分类专栏： Py小Bug 文章标签： python

本文链接：https://blog.csdn.net/qq_41251196/article/details/111438785

版权

Py小Bug 专栏收录该内容

19 篇文章 2 订阅

订阅专栏

多个span标签的值提取（不含空）

如图所示，首先通过selec()或者find_all()定位到需要爬取的标签，有四个标签，然后分别提取第一，第二，第四个标签，就用列表的思路提取。然后type(star.select(‘span’)[0])为<class ‘bs4.element.Tag’>

rating_star=print(star.select('span')[0]['class'])   #评星 
rating_num=star.find_all('span')[1].text   #评分    
comments=star.find_all('span')[3].text    #评价人数

在这里插入图片描述

多个span标签的值提取（含缺失标签）

但是当遇到，有的span标签缺失的情况就很尴尬，如图所示，两个span标签。但是有的第二个标签缺失。

在这里插入图片描述

提取第一个标签（chi_titile）简单：
chi_title=item.select(’.title’)[0].text

但是提取第二个标签(eng_title)，如果用
eng_title=item.select(’.title’)[1].text就会报错IndexError: list index out of range

参考：https://www.imooc.com/wenda/detail/506920，之后u尝试更好的方法是：
eng_title=item.find_all(‘span’,class_=‘title’)[1:2]实现第二个可能有缺失值的标签内容的提取，提取结果如下图（开心！！！！），然后type(item.find_all(‘span’,class_=‘title’)[1:2])为<class ‘list’>，同时第一个标签的提取相应为chi_title=item.find_all(‘span’,class_=‘title’)[0:1]

在这里插入图片描述

小白不太懂上述操作的原理，路过的大佬可以在评论区多多指教，鞠躬₍ ᕕ⍢ᕗ⁾

神经森森是我鸭

关注

4
点赞
踩
17

收藏

觉得还不错? 一键收藏
5
评论
#python 爬虫 #BeautifulSoup如何分别提取多个span标签的值

多个span标签的值提取（不含空）如图所示，首先通过selec()或者find_all()定位到需要爬取的标签，有四个标签，然后分别提取第一，第二，第四个标签，就用列表的思路提取。然后type(star.select(‘span’)[0])为<class ‘bs4.element.Tag’>rating_star=print(star.select('span')[0]['class']) #评星 rating_num=star.find_all('span')[1].text #
复制链接

扫一扫

专栏目录