搜索引擎
文章平均质量分 90
bigwangdi
通信专业六年学习,具有扎实的专业基础,软件开发实习一年,积累了开发经验。热爱软件开发、互联网、搜索、云计算等。热爱研究技术,喜欢使用所学知识解决实际问题,对技术有较强的领悟能力。
展开
-
倒排索引-搜索引擎的基石
本文转自:http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求: 1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索引都是亿级甚至几千的网页数量转载 2013-07-11 10:38:37 · 1110 阅读 · 0 评论 -
Trie树及其应用
Trie树Trie树,又称单词查找树、字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树结构。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。Trie树的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。 Tri原创 2013-07-11 15:51:10 · 1030 阅读 · 0 评论