深度优先搜素(DFS)
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件) 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次。
深度优先搜索类似于树的前序遍历
我们依据邻接表进行遍历,还需要运用递归的思想,这类似于堆栈的遍历方式。
同样以如下连通图为例:
构建其对应的邻接表:
采用深度优先搜素的遍历顺序如下: