网络爬虫中用到的宽度优先遍历算法

本文介绍了在网络爬虫中如何应用宽度优先遍历算法。通过队列实现节点的先进先出,从顶点A开始,按层次依次访问所有节点。该过程类似于爬虫的待抓取URL队列,直到队列为空,爬虫停止运行。
摘要由CSDN通过智能技术生成

最近学习自己动手写网络爬虫

书中涉及到了图的宽度优先遍历,其中很重要的一点是图的宽度优先遍历需要一个队列(队列的特点:先进先出)作为保存当前节点的子节点的数据结构。




以上图为例图的宽度优先遍历算法描述为:

    1.首先访问顶点A,将顶点A入队

    2.之后因为要访问A的邻接点,应先将A出队(我认为当要访问某个节点的邻接点时,应先将该节点从使其出队,之后访问该节点的邻接点),然后将A节点的邻接点B,C,D,E,F入队;

   3.因为队列先进先出,且还要依次访问队列中各节点的邻接点,所以将B出队,B无邻接点,于是C出队,C亦无无邻接点,于是D出队,同理应E出队,E有邻接点H,所以E出队后,H入队,因为

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值