SEO人员十大必备工具之相似页检查器

    声明:本文系作者詹然平原创,首发在SEO专业门户www.seo886.com】,欢迎转载,转载请注明出处。

    原文地址:http://www.seo886.com/Articles/20070711/seo_top10_tools_similar_page_checker1_1115.html

    首先,在介绍和使用相似页工具的之前,要明确什么是相似页,故名思议就是页面跟页面的内容非常相似,如果相似程度非常高,搜索引擎就可能会判定为重复内容。

    目前,就国内来说,很多新站都是靠copy其它网站的内容,而且大家互相抄袭,原创的内容非常少,而且很多站长是通过建立这种复制信息垃圾站来赚取广告费用,而且很多站长因此还变得富有,可是长远看来这个方法是非常有害的。对于搜索引擎来说,以google为例,它的理念是让用户能够最快找到有用的东西,显然到处复制别人内容的网站的价值就相对比较小,所以google应该是通过相似程度来判断内容是否是重复内容。从另一个角度说如果一个站的内部有大量相似页面,这样的网站也可能被搜索引擎认定为重复内容,跟早年时有的SEO人员提出的优化方案“将关键词重复一千遍”有相似之处,以搜索引擎技术的发展,这一招早就不灵了,如果有人还不与时俱进,继续使用这个招数的话,将得不偿失了,不仅不会有效果,反而会被将分处理。

    当然,就目前来说,大部分Web开发者和SEO人员都不会再使用大量重复来试图再搜索引擎得到加分,但是有一种情况却是应该注意的,就是由动态页面客观造成的相似页,动态页面基本框架都一样,所以相似程度应该很高,比如产品页面,基本除了产品名称、产品编号等参数变化以外,其他都不会变化。以笔者的亲身开发的一个玩具厂商名录(http://www.uctoyman.com)系统为例,在开发早期,察看具体厂商页面标题是一样的,只是根据不同的查询参数得到不同的结果,而且为了效率和优化等原因,还通过程序生成了静态页面,过了一段时间,网站如期被收录,后来通过site:uctoyman.com进行察看,发现收录的正常结果只有1条,其他全部变成是相似结果。后来通过相似页检查器进行察看后,发现两个查看页的相似程度居然是100%,对于内容本身来收,的确不是一样的,因为具体产品是从数据库进行读取的。

    出现这样的情况当然对于搜索引擎收录来说并不是一个好的消息,那么如果解决呢?既然是相似度高,那么降低相似程度就可以了。主要有如下一些解决方法:

  1.  将标题进行独立化,标题不能一样,这一点非常重要。
  2. 每个页的meta keywords和meta description要不一样。
  3. 将一些每一页都会有,但对搜索引擎收录没有帮助的文字变成图片或者通过javascript脚本进行输出,比如分页、常规连接等。
  4. 根据内容本身进行优化。这个就要根据网站本身的情况来说了。比如常规性的介绍文字(就是每页都有的文字)可以放到页面的后面,让唯一的内容放到前面,比如厂商介绍是唯一的内容,就可以在HTML结构上放到前面去,这样搜索引擎在截取的时候就会发现不一样的内容,这样就可以避免。

通过以上优化后,在通过检测后就变成了57%了,当然原则上是越低越好,但是70%左右就不会被google认为是重复内容了,因为对于这样详细察看页面来说,本来结构上就很相似,所以能够57%就是比较好的情况了。测试结果如图1所示。

相似页检查结果图

图1 通过优化后相似程度降低到57

  下面来讲讲相似页检查器的原理和使用方法。它的工作原理是模拟搜索引擎的抓取和截取方法,然后将抓取和截取的文本进行字符串比较,通过比较得出相似程度,使用就非常简单了,一般相似页检查器以在线形式的比较多。

 通过下面提供的表单可以马上体验相似页检查器的使用。

 

相似页检查器

 

输入第一个URL

 

输入第二个URL

 

 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值