原文第二版
简介
深度优先搜索(Depth First Search),是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件) 。简单来说,就是一条道走到黑,不撞南墙不回头,撞上南墙往回走,走完撞北墙[doge]。为了方便理解,这里有一张简单地图(随便画的,请见谅):
上图为简简单单的小小三国示意图,问,从长安出发,能不能统一全国,即能不能到达所有点。
从长安,可以直接去益州,但回不来(因为是单向的),也可以去许昌,不妨选择许昌。
从许昌,可以去洛阳、荆州、长安,但因为是从长安来的,不能回去了。另外两座城市中,选择先去洛阳。
从洛阳,可以去许昌、荆州、建业,但是从许昌来的,不能回去,选择去建业。
从建业,可以去荆州、洛阳,为了不回去,所以去荆州。
从荆州,可以去许昌、建业、益州,许昌、建业都去过了,所以去益州。从此,统一大业完成。
可以这样理解:想象一个二叉树,一直遍历每一个点的左子节点,直到叶子节点,