python基础爬虫——深度优先与广度优先

本文介绍了Python爬虫中两种常见的数据抓取策略:深度优先和广度优先。通过示意图和代码解释,阐述了深度优先利用栈,广度优先利用队列的实现方式。
摘要由CSDN通过智能技术生成

困于心衡于虑而后作
今天的学习目标是:深度优先与广度优先爬取数据

深度优先与广度优先示意图:
在这里插入图片描述

1.深度优先使用栈来完成


# 如果我们不适用递归程序实现深度优先的顺序爬取网页数据,也可以设计一个栈stack来完成
# 在python中实现一个栈很容易,python中的list就是一个栈,很容易设计一个自己的stack栈


import urllib.request
from bs4 import BeautifulSoup


class Stack:
    def __init__(self):
        self.st = []

    def pop(self):
        return self.st.pop()

    def push(self, obj):
        self.st.append(obj)

    def empty(self):
        return 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值