python网络爬虫 - BeautifulSoup(1) .find() & .find_all()

最新推荐文章于 2024-09-24 15:51:04 发布

mifaxie

最新推荐文章于 2024-09-24 15:51:04 发布

阅读量3.9k

点赞数 1

分类专栏：学习笔记文章标签： python 爬虫 BeautifulSoup Web scraping with python

本文链接：https://blog.csdn.net/mifaxie/article/details/79340610

版权

本文介绍了如何使用Python的BeautifulSoup库进行网页抓取，通过实例展示了.find()和.find_all()方法的使用，包括查找指定标签和属性，以及在不同版本中的兼容性。

摘要由CSDN通过智能技术生成

0. 前言

在介绍BeautifulSoup模块前，我们先分析一下我们要爬取的网页结构是什么样的。通常网页都包含层叠样式表(英文全称：Cascading Style Sheets），例如。推荐使用谷歌浏览器或者火狐浏览器方便快捷查看网页结构。例如在chrome中百度首页右击，选择’inspect’，即可查看到网页结构，以及各个标签层级关系。