网站服务器日志分析,SEO必备:网站日志分析

作为一名seoer,对

一、网站日志可以为我们做什么?

1、 可以分析爬虫抓取页面有效性(减少搜索引擎在一些噪音页面上:重复页面,低质量页面,空内容页面,404页面,不排名页面 的抓取频率);

2、排查网站页面中存在的404错误页面,500服务器错误等

3、页面重要内容是否被爬虫完整爬到并且快速遍历;

4、正确分辨蜘蛛爬虫

二、常见HTTP状态码解读

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

接着,我列举一个网站日志的案例:

日志里的含义,可以大家看下网站日志中各个数据都代表什么意思,总之这个文件是记录的一天发生在网站上的一些行为。当我们拿到这么一个网站日志,我们就可以审视我们的日志,并且通过对日志文件分析解决网站存在的问题;

三、日志代码解读

从日志文件当中可以解读出两个部分内容:

1、搜索引擎抓取情况

从日志文件中,可以大家看到搜索引擎抓取了一些404页面及低质量重负页面(噪音行为)

备注:可以通过nslookup  ip 识别蜘蛛的真假

/date-2016-01.html(低质量重负页面)

/author-1.html(低质量重负页面)

/downloads/(低质量页面)

/contact.html(死链接接),但这里有个问题,这个页面返回的状态码为200而不是404,但页面却跳转到404页面,从中可以发现服务器设置一定有问题;

所以,当我们有一些页面不希望他们抓取的时候,我们需要在robots中进行规范。规范robots一个重要的手段,就是robots.txt。爬虫纠偏,让爬虫花更多的精力放在我的详情页面上。

2、用户访问网站情况

关于用户网站访问情况, 主要分析用户访问网站行为轨迹及用户属性,在这就不进行讲述

版权说明:如非注明,本站文章均为裕腾智工作室原创,转载请注明出处和附带本文链接

http://www.ying88.net/seoyouhua/42.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值