海量数据处理
database_system
这个作者很懒,什么都没留下…
展开
-
bit-map
1,所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。 【适用范围】 可进行数据的快速查找,判重,删除,一般来说数据范围是int的10倍以下 【基本原理及要点】 使用bit数组来表示某些元素是否存在,比如8位电话号码 【扩展】 Bloom filter可以看做是对bit-map转载 2012-09-20 13:23:11 · 539 阅读 · 0 评论 -
bloom filter
1 Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见 Bloom filter 是牺牲了正确率换取时间和空间。转载 2012-09-20 09:43:57 · 374 阅读 · 0 评论