解说网站IIS日志蜘蛛爬行状态代码

什么是IIS日志?
IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。

下面为你详细分析IIS日志
例:
2009-11-26 16:00:01 GET /index.asp - - 66.249.67.41 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) - 200 71879 .
  分析 ..
  date(日期)===========2008-10-14
  time(时间)===========16:00:01
  cs-method(方法)=======GET .
  cs-uri-stem(URI资源)==== /index.asp //代表访问的资源是当前这个文件 !
  cs-uri-query(URI查询)==== - //
  cs-username========== - .
  c-ip(客户端IP)==========66.249.67.41 ...
  cs-version ============HTTP/1.1 //协议版本 .
  cs(User-Agent)=========Mozilla/5.0+         (compatible;+Googlebot/2.1;++http://www.google.com/bot.html) //谷歌在收录 ..
  cs(Referer) (引用站点) ===== - //搜索的站点 .
sc-status(协议状态)======= 200 //200表示OK 特别注意:
sc-bytes(发送的字节数)===== 71879 //表示当前文件的大小  

一些常见的状态代码为:
               200 - 服务器成功返回网页 
               404 - 请求的网页不存在
               503 - 服务器暂时不可用

网页状态码含义:
2xx  成功
200  正常;请求已完成。
201  正常;紧接 POST 命令。
202  正常;已接受用于处理,但处理尚未完成。
203  正常;部分信息 — 返回的信息只是一部分。
204  正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx  重定向
301  已移动 — 请求的数据具有新的位置且更改是永久的。
302  已找到 — 请求的数据临时具有不同 URI。
303  请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304  未修改 — 未按预期修改文档。
305  使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306  未使用 — 不再使用;保留此代码以便将来使用。
4xx  客户机中出现的错误
400  错误请求 — 请求中有语法问题,或不能满足请求。
401  未授权 — 未授权客户机访问数据。
402  需要付款 — 表示计费系统已有效。
403  禁止 — 即使有授权也不需要访问。
404  找不到 — 服务器找不到给定的资源;文档不存在。
407  代理认证请求 — 客户机首先必须使用代理

对SEO优化者来说,IIS日志是必须了解的基本入门信息,不紧需要了解IIS日志状态码含义,而且还需要了解各大搜索引擎爬虫(蜘蛛Robot)名称。通过IIS日志我们可以了解到蜘蛛爬取情况及网站流量访问情况。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值