Bloom Filters by Example (链接:http://billmill.org/bloomfilter-tutorial/)
以下是关于布鲁姆过滤器的知识点
布隆过滤器是一种数据结构,快速和节省内存,能用于判定一个元素是否存在于一个集合中。
这种效率的代价是Bloom filter是一种概率数据结构,元素不是绝对的在组里或可能在组里。
Bloom filter的基本数据结构是一个位向量。
在以下文本,我们
用
ķ个
哈希值,m位的过滤器
,和n
个
已插入的元素来介绍Bloom filter
哈希函数
Bloom filter应使用的哈希函数是独立和均匀分布的,使哈希函数运行时尽可能的快。(而加密散列如sha1,尽管被广泛使用,但不是很好的选择)。
例子:简单的散列足够独立,其中包括 murmur, the fnv series of hashes, and Jenkins Hashes.