一般情况下进行子元素的查找最常用的都是这两个find()与children(),而进行父级查找基本都是用parent()与parents()
简单来说,children()只能寻找目标标签的下一级(儿子辈),而find()是寻找目标标签的所有下级(所有后代)
那parent()与parents()这两个的区别:简单来说,parent()只能寻找目标标签的上一级(父辈),而parents()是寻找
目标标签的所有上级。同样的我们类推一下就知道parents()和parent()这两个元素使用方法了
代码分析:
使用bs4抓取页面的翻页链接,我们可以抓到 "“后,再使用"find_parent”,拿到上一级(父辈)元素的 翻页链接
<a href="/8hr/page/2/" rel="nofollow">
<!--<a href="/8hr/page/2/" rel="nofollow">-->
代码如下:
# 找到下一页
next_page = pages.find('span', class_='next')
nextUrl = next_page.find_parent('a').get('href')
"""
<li>
<a href="/8hr/page/2/" rel="nofollow">
<!--<a href="/8hr/page/2/" rel="nofollow">-->
<span class="next">
下一页
</span>
</a>
</li>
"""