蜘蛛深度抓取和广度抓取

本文介绍了搜索引擎蜘蛛的两种抓取策略——深度抓取和广度抓取。深度抓取是从一个链接开始,沿着路径深入到最后,而广度抓取则是先抓取当前页面所有链接。影响蜘蛛抓取的因素包括网站地图、404错误页面、导出链接数量以及导入链接的质量和多样性。合理利用这些因素,有助于提高网站的搜索引擎可见性。
摘要由CSDN通过智能技术生成

深度抓取:蜘蛛发现一个链接时,会沿着链接路径一直爬行到最深一层,直到不能再爬,返回最初页面爬行下一个链接。
广度抓取:蜘蛛会抓取当前页面链接中的所有网页,然后选择其中一个网页,继续抓取页面中的所有链接。

蜘蛛深度抓取和广度抓取

影响蜘蛛抓取的因素:
1、网站地图
网站地图对搜索引擎蜘蛛而言,就相当于一副爬行路线图,有路线图的指引,能大大提升蜘蛛爬取页面的速度。就好比去陌生的城市,需要地图指引是一样的道理。

2、404错误页面
网站维护、内容改版不可避免的会出现死链问题。当蜘蛛爬行到死链,就如同进入死胡同,没有出口。如果网站死链较多,又没有404页面,在站长工具进行查询时,就会发现很多页面抓取错误。而404页面的意义就在于,告诉搜索引擎当前内容不存在,可以沿着404页面链接路径,返回首页或者查看其他相关内容。蜘蛛深度抓取和广度抓取?

3、导出链接过多
蜘蛛爬取网站时,有时按照深度抓取,有时按照广度抓取方式进行抓爬,当蜘蛛按照广度抓取时,还没来得及进入最深层页面,就沿着导出链接直接出去了,因此,网站不宜设置过多导出链接。

4、导入链接过少
导入链接建设遵循以下2个原则:
多样性:可以注册多个外链发布平台,以防其中某个账号封停造成外链大幅波动;
高质量:相关性的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值