Google最新算法 - 人肉搜索引擎

跟mop没什么关系,但早在上个月我就在donews论坛里看到一叫尚北京的哥们发明了人肉搜索引擎-即手工处理每个查寻,以email方式发送给你最准确的查寻结果。乍一看觉得不可能完成的任务,但是仔细想想只要人手够多就完全有可能,因为Google现在就是这样做的。

在前些天发的Google半官方对一些问题的解释一文里,提到了TrustRank这个名词。TrustRank是Google最近注册的一个专利名称,从名字上猜测是给个网站一个Trust值,人品高的Trust度高,人品差的Trust度低。然后根据这个Trust值去rank。听起来不错,不但听起来不错,而Google也正在这么做。

Google招聘页面里,有个职叫Quality Evaluation Associate/Administrator 。简单的说这个职位的工作是每天使用Google,然后挑出垃圾页面。一些分析apache raw log的站长发现一个叫eval.google.com的引用连接(即有人在eval.google.com为主机的页面点击该站长的网站URL,导致log文件留下了访问痕迹)。这显然是Quality Evaluation Associate/Administrator工作的动静。可以80%以上肯定的说,所有这些都在为Google TrustRank做准备。

面对TrustRank站长可以做些什么?

首先是正规的SEO手段了,包括(想到什么说什么):

  1. 有内容的网站
  2. 知道搜索引擎对网站的要求(Google 向网站管理员提供的信息, 百度与站长)
  3. 一致的站内链接策略(见Google半官方对一些问题的解释最后一个问题)
  4. 中文语句通顺,英文拼写正确,标点使用规范
  5. 最好使用XHTML web标准制作网站
  6. 每页主题明晰
  7. 不连接到人品差的网站
  8. 准确的whois信息

其次,别忘了TrustRank后面是人而不是Googlebot,所以网站要考虑人的因素(其实是废话,但现在很多网站都是给搜索引擎做的):

  1. 使用与Google相同的价值观建造和维护网站: Google 发现的十大真理  
  2. 有隐私策略页面(sina的隐私策略页面)。注意隐私策略不是形式,而是实事求是。比如你写了cookie,就要在该页面中说明为什么要写这个cookie,如何清除。又如用户需要注册,你就要说明你都用这些数据干什么,会不会把这些数据给别人,如果给为什么给。再如如果访问者可以订阅邮件列表,你就要说明如何退定,如何保证不把用户的email地址做垃圾邮件地址使用等等
  3. 有使用条款页面(Yahoo使用条款页面)。跟隐私策略页面一样,使用条款也要因网站而异。用户浏览你的网站就要遵守这些条款。
  4. 不要有SPAM记录。比如你的网站长期发送垃圾邮件、在论坛上SPAM,准会有人报告SPAM,这样一些机构会有记录。(某越南IP的SPAM记录:http://www.whois.sc/rbl/?ip=203.168.222.35
  5. 不要有乱七八糟的广告。这一点最重要,一些穷疯了的网站没有任何自己的内容,满屏飞广告。类似Adsense这样的干净的广告和内容健康位置固定的图片广告是没有问题的。
  6. 不要有违法内容,如提供破解软件、盗版电影等内容的网站是不会有好结果的。
  7. 没有原创内容的网站不应该存在。如果你的网站全是转载别人网站的内容,TrustRank是高不了的。

还有很多,越想越多。其实还是这句话,网站是给人做的,不是跟搜索引擎做的。再加一句:用不道德手段骗钱是对未来的透支 -可能透支未来的机会,可能透支未来的时间,可能透支未来的自由。

转载于:https://www.cnblogs.com/dnuace/archive/2006/03/16/351054.html

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值