算法探讨
wangmeng882
这个作者很懒,什么都没留下…
展开
-
海量数据处理专题(二)——Bloom Filter
海量数据向来都是百度,淘宝,腾讯面试的热点,虽然微软不看重这个,但是了解一下还是很有必要的。 最近在写倒排索引,希望继续关注本博。 =========================================================== 【什么是Bloom Filter】 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集...2011-08-29 00:56:43 · 109 阅读 · 0 评论 -
海量数据处理专题(八)——倒排索引(搜索引擎之基石)
引言: 在信息大爆炸的今天,有了搜索引擎的帮助,使得我们能够快速,便捷的找到所求。提到搜索引擎,就不得不说VSM模型,说到VSM,就不得不聊倒排索引。可以毫不夸张的讲,倒排索引是搜索引擎的基石。 VSM检索模型 VSM全称是Vector Space Model(向量空间模型),是IR(Information Retrieval信息检索)模型中的一种,由于其简单,直观,高效,所以被广泛的应...2011-09-27 10:10:09 · 348 阅读 · 0 评论