1.布隆过滤器基础
简单来说,布隆过滤器可以看作是一个【位数组】。存的都是0或者1。
位数组中每个元素都只占用1bit;
它是一种概率性数据结构,可以实现高效插入和查询。
通常都是用来检索某个元素是否在给定的大集合中***
能告诉你:XXX一定不存在或者可能存在,给你的结果不是确切的,更加的高效、占用空间小*。
2.布隆过滤器原理?(如何使用它去判断元素是否存在)
思考:通常情况下,我们判断某个元素是否存在,会使用HashMap,因为Key是唯一的,我们就可以去查询一个元素的Key,而去找到这个元素。时间复杂度是O(1),效率很高。但是当存储的数据量很大时,也会占用很大内存。
布隆过滤器可以实现更加快速的查询。
如图所示,当字符串存储要加入到布隆过滤器中时,该字符串首先由多个哈希函数生成不同的哈希值,然后在对应的位数组的下表的元素设置为 1(当位数组初始化时 ,所有位置均为0)。