困于心衡于虑而后作
今天的学习目标是:深度优先与广度优先爬取数据
深度优先与广度优先示意图:
1.深度优先使用栈来完成
# 如果我们不适用递归程序实现深度优先的顺序爬取网页数据,也可以设计一个栈stack来完成
# 在python中实现一个栈很容易,python中的list就是一个栈,很容易设计一个自己的stack栈
import urllib.request
from bs4 import BeautifulSoup
class Stack:
def __init__(self):
self.st = []
def pop(self):
return self.st.pop()
def push(self, obj):
self.st.append(obj)
def empty(self):
return