http://FullSearch.Com 中文全文检索网 2006-2-5 15:59:10 sigz |
关键词:搜索引擎优化 反作弊 antispam |
Antispam就是反垃圾、反作弊的意思,spam的意思是:兜售信息[邮件,广告,新闻,文章],非索要信息。与垃圾邮件(junk mail)同义。Anti就是反对、去除的意思。这个词汇多用于反垃圾邮件。也用于形容搜索引擎反垃圾信息。Spam和antispam在搜索引擎诞生之日起就开始了无休止的搏杀。因为有巨大的商业利益掺杂其中。 2003年上半年之前中文搜索引擎基本上没有大规模的搜索引擎作弊。2002年的时候百度的讨论区有搜索引擎爱好者讨论搜索技巧、搜索引擎相关知识会讨论到优化、友好,但是范围非常小,气氛主体是搜索技巧。也有部分人和公司做搜索引擎优化的,但是仅仅是针对某几个词汇做链接以获取在google的排名收取企业费用。当时我们还讨论过作弊和友好的界限定义很难区分的问题,现在想想,当时这种问题对中国人来说根本没有必要讨论。 2003下半年中文搜索引擎作弊大面积泛滥,一时间“google、百度被爆奸了”甚至有人可以包揽某类关键词前几十页的所有条目,有人声称可以将任何词汇做到百度的前几名……,到2005年已经是全民作弊了。 这时候,antispam成为中文搜索引擎的重点工作之一了。搜索引擎反作弊从开始以来一直都是处于被动防守状态,这是因为必须有人作弊,才能反作弊,几乎不可能预知作弊的新方式来预先antispam。而且也不存在破窗理论,因为一个网站作弊在某搜索引擎无效,但是会在其它搜索引擎有效。长期无效,但是短期有效。 Antispam的目的是为了改善用户体验,丢弃垃圾信息。垃圾信息包括重复无穷次的信息和没有任何价值的信息,internet本来就存在很多的垃圾页面和垃圾信息和重复信息,再加上有很多人为的制作垃圾信息,那搜索引擎反垃圾就凸现出重要性了。 反作弊其实不难,搜索引擎能管理数十亿的信息,那管理这么点垃圾信息还不是很轻松的事情?因为作弊具有共性,抓住这些共性就可以解决一类问题,一类问题一类问题的解决,作弊的影响就可以降到最低。极大程度的增加作弊的成本和风险。 方法大致可以如下:建立每个网页和网站的spam系数,这个系数和这些参数相关: 搜索引擎的反作弊和逐利的人们还会不断的博弈下去, 还存在一些问题: 原创文章,无版权,可以任意转载,但是转载必须完整转载全文、本文url和内部解释性链接。
|
本文地址:http://www.FullSearcher.Com/n200512611555735.asp |
网站地址:http://www.FullSearcher.Com/ |
文章来源:原创 |
Antispam,反垃圾,反作弊[转载]
最新推荐文章于 2023-02-23 18:31:54 发布