学会分析IIS日志 了解蜘蛛动向

2011-03-08 15:52:03  W3SVC1  91.157.164.84  GET /Hd2500.html- 80 - 220.181.7.74 Baiduspider+(+baidu/search/spider.htm)20000


   分析下 200 0 0组成部分    sc-status(协议状态) sc-substatus(协议子状态) sc-win32-status(Win32状态码)


 sc-status(协议状态): 200 连接成功


 sc-substatus(协议子状态) :0 成功


 sc-win32-status(Win32状态码):0代表抓取成功并带回数据库 ;64 指定的网络名不再可用



1: 在这个访问记录里面91.157.164.84是你服务器的IP地址,220.181.7.74  是bd蜘蛛的IP,/Hd2500.html为蜘蛛访问你的页面 80是端口 GET是打开方式 W3SVC1是记录的文件夹,这里说明,bd蜘蛛已经访问了你的Hd2500.html这个页面,那么最重要的是最后面的这个参数200 0 0


2、20000成功访问该页面,0代表抓取成功并带回数据库。这个时候你就放心了,这个页面已经被bd收录,但是还没有释放出来,bd更新时就可能释放出来。


3:200 064 网络上流传着这么三种解释第一:64为K站的前兆。第二64的出现只是64位操作系统。第三:网络不可达,由于某种原因无法完全打开页面,或者网络不稳定这些原因,导致蜘蛛无法带回页面或者说不抓取该页面,所以200 064的解释也应该为:访问了该页面,但并没有任何抓取也没有带回数据库。这种原因多为空间不稳定、服务器不稳定。


4:302 0 0在日志中发现302的返回码也是需要注意的,302为临时重定向,如果是长期的将这个页面重定向到另一个页面,使用301永久重定向,302的话bd蜘蛛下次来还会访问这个页面,这样又会造成复制大量页面的问题,结果肯定是K,所以,抽空检查以下。

5:3040 0这个返回码代表蜘蛛访问的页面没有更新,和他之前来的时候是一样的,所以看到这个不要担心,蜘蛛来过,只不过你没有更新,所以他也不愿意带走这个页面。


6:4040 0这个是代表404页面,但是有个很严重的问题,这个返回码告诉我们,蜘蛛来到了404页面并把他带走了,崩溃~~~~,塞是这样的话基本上你要倒霉了,塞你有太多的404,那么蜘蛛就会不断是抓取,不断的带走,这样会造成无数的重复页面,最终导致K站或者降权,正确的返回骂是404064 这就代表蜘蛛没有抓取你这个页面。


7:500错误500错误是服务器内部错误,是由程序的错误造成的,我不懂程序,但是500错误是会给你减分的,这点基本的逻辑都可以想的到,塞发现500错误,马上查看是哪个页面的,然后去修正以下错误吧!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值