【实战问题】-- 布隆过滤器的三种实践:手写,Redission以及Guava(2)

本文介绍了布隆过滤器的原理,并分别展示了如何手写布隆过滤器、利用Redis以及Google Guava实现。手写实现中强调了位数组大小和多哈希函数的选择,Redis实现利用`SETBIT`和`GETBIT`命令,Guava实现则直接提供了相关API。文章还提及了误判率的设定及其影响。
摘要由CSDN通过智能技术生成

前面我们已经讲过布隆过滤器的原理【实战问题】-- 缓存穿透之布隆过滤器(1),都理解是这么运行的,那么一般我们使用布隆过滤器,是怎么去使用呢?如果自己去实现,又是怎么实现呢?

布隆过滤器

再念一次定义:

布隆过滤器(Bloom Filter)是由布隆(Burton Howard Bloom)在 1970 年提出的,它实际上是由一个很长的二进制向量和一系列随机hash映射函数组成(说白了,就是用二进制数组存储数据的特征)。

譬如下面例子:有三个hash函数,那么“陈六”就会被三个hash函数分别hash,并且对位数组的长度,进行取余,分别hash到三个位置。

如果对原理还有不理解的地方,可以查看我的上一篇文章。

手写布隆过滤器

那么我们手写布隆过滤器的时候,首先需要一个位数组,在Java里面有一个封装好的位数组,BitSet

简单介绍一下BitSet,也就是位图,里面实现了使用紧凑的存储空间来表示大空间的位数据。使用的时候,我们可以直接指定大小,也就是相当于创建出指定大小的位数组。

BitSet bits = new BitSet(size);

同时,BitSet提供了大量的API,基本的操作主要包括:

  • 清空位数组的数据
  • 翻转某一位的数据
  • 设置某一位的数据
  • 获取某一位的数据
  • 获取当前的bitSet的位数

下面就讲一下,写一个简单的布隆过滤器需要考虑的点:

  • 位数组的大小空间,需要指定,其他相同的时候,位数组的大小越大,hash冲突的可能性越小。
  • 多个hash函数,我们需要使用hash数组来存,hash函数需要如何设置呢?为了避免冲突,我们应该使用多个不同的质数来当种子。
  • 方法:主要实现两个方法,一个往布隆过滤器里面添加元素,另一个是判断布隆过滤器是否包含某个元素。

下面是具体的实现,只是简单的模拟,不可用于生产环境,hash函数较为简单,主要是使用hash值得高低位进行异或,然后乘以种子,再对位数组大小进行取余数:

import java.util.BitSet;

public class MyBloomFilter {
   

    // 默认大小
    private static final int DEFAULT_SIZE = Integer.MAX_VALUE;

    // 最小的大小
    private static final int MIN_SIZE = 1000;

    // 大小为默认大小
    private int SIZE = DEFAULT_SIZE;

    // hash函数的种子因子
    private static final int[] HASH_SEEDS = new int[]{
   3, 5, 7, 11, 13, 17, 19, 23, 29, 31};

    // 位数组,0/1,表示特征
    private BitSet bitSet = null;

    // hash函数
    private HashFunction[] hashFunctions = new HashFunction[HASH_SEEDS.length];

    // 无参数初始化
    public MyBloomFilter() {
   
        // 按照默认大小
        init();
    }

    // 带参数初始化
    public MyBloomFilter(int size) {
   
        // 大小初始化小于最小的大小
        if (size >= MIN_SIZE) {
   
            SIZE = size;
        }
        init();
    }

    private void init(
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值