网站页面收录需要经历那些阶段?



网站不仅要被搜索引擎抓取,还要被收录,最重要的是在收录后有良好的排名,每个网站、每个网页的排名都是不一样的,下面小编带大家分析一下网页收录需要经历的四个阶段。站长们可以看看自己的网站已经达到哪一个阶段了。

1、网页收录第一阶段:一律通杀

搜索引擎的网页抓取都是采取「一律通杀」的策略,就是把网页中能发现的链接逐一加入到待抓取URL中,这种方式虽然比较古老,但效果很好,这就是为什么很多站长反应蜘蛛来访问了,但没有收录的原因,这仅仅是第一阶段。

2、网页收录第二阶段:网页评级

而第二阶段则是对网页的重要性进行评级,PageRank是一种链接分析算法,可以用来衡量网页的重要性, 爬虫的目的就是去下载网页,但PageRank是个全局性算法,也就是当所有网页有下载完成后,其计算结果才是可靠的。对于中小网站来讲,服务器如果质量不好,如果在抓取过程中,只看到部分内容,在抓取阶段是无法获得可靠的PageRank得分。

3、网页收录第三阶段:OCIP策略

OCIP策略更像是PageRank算法的改进。OCIP大致与PageRank思路一致,区别在于:PageRank每次要迭代计算,而OCIP则不需要,所以计算速度远远快于PageRank,适合实时计算使用。这可能就是为什么很多网页会出现「秒收」的情况了。

4、网页收录第四阶段:大站优先策略

大站优先的思路很直接,以网站为单位来衡量网页的重要性,对于待抓取的URL队列中的网页,根据所述网站归类,如果哪个网站等待下载的页面最多,则优先下载这些链接。因为大型网站往往包含更多的页面。大型网站网页质量一般较高,所以大战优先收录是有理可据。更多网站知识请登录比特建站http://www.bitjz.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值