- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 网页作弊
出于商业利益考虑,许多网站站长会针对搜索引擎排名进行分析,并采取一些手段将网页的搜索排名提高到与其质量不相称的位置。目前常见的作弊方法包括:内容作弊、链接作弊和隐藏作弊一、内容作弊内容作弊的目的是通过精心更改或者调控网页内容,使得网页在搜索引擎排名中获得与其网页不相称的排名。搜索引擎排名算法一般包括内容相似性计算和链接重要性计算,内容作弊就是通过提高内容相似性计算的得分而获得最终的高排名。
2012-02-24 20:14:30 2312
原创 搜索引擎的技术架构
作为互联网应用中最具技术含量的应用之一,优秀的搜索引擎需要复杂的架构和高效的算法,以此来支撑对海量数据的获取、存储,以及对用户查询的快速而准确的响应。下图所示是一个通用搜索引擎的架构示意图。搜索引擎由许多模块组成,各自负责不同的功能作用,相互配合形成完整的架构。 搜索引擎的信息来自于互联网网页,通过网络爬虫将整个互联网的信息获取到本地存储起来。因为互
2012-02-16 17:13:16 2523
原创 折半查找及其扩展
在查找算法中,最简单的方法就是顺序查找,其复杂度为O(n)另一种很高效的方法就是折半查找,主要思想为:中间元素与给定查找元素比较,如果相等则返回该位置,如果大于给定元素则从低半区查找,如果小于给定元素则从高半区查找,如此往复,直至查到元素为止。折半查找的复杂度为O(logn),但使用该方法的前提是在已序的数组中。程序如下:int search(int array[],int n,int v
2012-02-15 19:55:10 1070 1
原创 如何快速找出单词的变位词
给定一个英语字典,找出其中的所有变位词的集合。例如,”pots”、”stop”和”tops”互为变位词,因为每一个单词都可以通过改变其他单词中字幕的顺序来得到解决这个问题最直接的想法就是全排列给定的单词,对于得到的每一个字符串序列从字典中查找是否为一单词,如果是则输出否则测试下一个序列。对于短单词不失为一种实现方法,但是如果单词的长度很长,如”cholecystoduodenostomy”的一
2012-02-15 19:44:10 5275 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人