微服务解决方案 -- BloomFilter 布隆过滤器 (外传二)

最新推荐文章于 2022-10-20 17:43:21 发布

LaoShiRen1207

最新推荐文章于 2022-10-20 17:43:21 发布

阅读量375

点赞数

分类专栏：微服务解决方案文章标签： java

本文链接：https://blog.csdn.net/weixin_42126468/article/details/106163501

版权

微服务解决方案专栏收录该内容

19 篇文章 3 订阅

订阅专栏

布隆过滤器

场景分析

在这里插入图片描述
如何解决这个问题，这个时候会想到布隆过滤器，有用redis的，也有用guava的，还有自己实现的。

首先布隆过滤器是一个bit向量或数组，这里就当做数组了。

我们得初始化这个数组即给与这个过滤器一定的长度，然后我们对一个key进行hash算法，可以多次hash，下图就hash了3次，将数组的对应的index的值设置为1。

在这里插入图片描述
完成了以后当该key再次请求过来的时候将三次hash的结果进行与运算，如果结果为1时就说明我们的这个key存在，即可以继续请求缓存或者数据库，如果为0就直接返回。如果一个key的hash结果与其他key的hash结果有冲突的话，就出现误判的情况。

// 假设我的bloomFilter算法用的是String的hashCode()的方法，就会出现哈希碰撞
 @Test
  public void testVoid(){
      System.out.println("Ea".hashCode());
      System.out.println("FB".hashCode());
  }
// 打印结果
// 2236
// 2236

这就是 否一定为否，真不一定为真 。在这里插入图片描述

实现

关于BloomFilter的实现也有很多，我们就用最简单的guava

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>25.1-jre</version>
</dependency>

@Test
    public void bloomFilter(){
        // 指定过滤器的大小
        int size = 100000;
        // 误差率
        double fpp = 0.001;
        BloomFilter<String> bloomFilter = BloomFilter.create(Funnels.stringFunnel(Charset.forName("utf-8")), size, fpp);
        // 将过滤器存满数据，当数据<1000000时 一定存在，大于1000000 理论上不存在，但是存在误判
        for (int i = 0; i < 100000 ; i++) {
            bloomFilter.put(""+i);
        }

        int count = 0;
        // 取100000以上的数字 执行1000000次 存在一次 计数器+1
        for (int j = 100000; j < 200000 ; j++) {
            if (bloomFilter.test(""+j)){
                count++;
            }
        }
        System.out.println(count/100000.0);
    }

// 打印结果
0.00112