- 博客(4)
- 收藏
- 关注
原创 搜索引擎反作弊之:整体技术思路
本文节选自《这就是搜索引擎:核心技术详解》第八章 如上所述,目前搜索引擎作弊手段五花八门,层出不穷,作为应对方的搜索引擎,也相应调整技术思路,不断有针对性地提出反作弊的技术方案,所以如果整理反作弊技术方案,会发现技术方法很多,理清思路不易。 尽管如此,如果对大多数反作弊技术深入分析,会发现在整体技术思路上还是有规律可循。从基本的思路角度,可以将反作弊手段大致划分为以下三种:
2012-03-30 22:05:19 12406 2
原创 搜索引擎反作弊之:链接作弊与隐藏作弊
本文节选自《这就是搜索引擎:核心技术详解》第八章8.2 链接作弊 所谓“链接作弊”,是网站拥有者考虑到搜索引擎排名中利用了“链接分析”技术,所以通过操纵页面之间的链接关系,或者操纵页面之间的链接锚文字,以此来增加链接排序因子的得分,并影响搜索结果排名的作弊方法。常见的链接作弊方法众多,此节简述几种比较流行的作弊方法。 1.链接农场(Link Farm) 为了
2012-03-27 22:48:46 7005
原创 搜索引擎反作弊之内容作弊
本文节选自《这就是搜索引擎:核心技术详解》第八章 网页反作弊是目前所有商业搜索引擎需要解决的重要难点,出于商业利益驱使,很多网站站长会针对搜索引擎排名进行分析,并采取一些手段来提高网站排名,这种行为本身无可厚非,很多优化行为是符合搜索引擎排序规则的,但是也存在一些恶意的优化行为,通过特殊手段将网页的搜索排名提高到与其网页质量不相称的位置,这样会严重影响搜索引擎用户的搜索体验
2012-03-24 08:53:04 12863 1
原创 搜索引擎索引之如何更新索引
本文节选自《这就是搜索引擎:核心技术详解》第三章 动态索引通过在内存中维护临时索引,可以实现对动态文档和实时搜索的支持。但是服务器内存总是有限的,随着新加入系统的文档越来越多,临时索引消耗的内存也会随之增加。当最初分配的内存将被使用完时,要考虑将临时索引的内容更新到磁盘索引中,以释放内存空间来容纳后续的新进文档,此时要考虑合理有效的索引更新策略。常用的索引更新策略有四种:完全重
2012-03-21 22:13:59 8154 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人