布隆过滤器 (java)

布隆过滤器 (java)

概述

布隆过滤器概念:https://www.cnblogs.com/liyulong1982/p/6013002.html

布隆过滤器主要用于:

  • 判断数据是否存在(有误判率,但不会出现假反例的情况,即不存在的数据一定会被过滤掉)
  • 防止缓存穿透

google的工具包

做开发的当然没什么时间自己实现一套布隆过滤器,而且布隆过滤器还是会涉及数学知识,需要一些数学的功底,不是说想写就写的。但是google已经有一套布隆过滤器实现,所以我们拿来用十分方便。

guava里面有布隆过滤器的实现。

<!-- https://mvnrepository.com/artifact/com.google.guava/guava -->
<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>30.1.1-jre</version>
</dependency>

hutool工具包

国人开发的一套工具包,十分好用,里面也有布隆过滤器的实现

官网地址:Hutool — 🍬A set of tools that keep Java sweet.

<!-- https://mvnrepository.com/artifact/cn.hutool/hutool-all -->
<dependency>
    <groupId>cn.hutool</groupId>
    <artifactId>hutool-all</artifactId>
    <version>5.7.5</version>
</dependency>

简易的实现

代码实现来自https://www.cnblogs.com/xiaobaituyun/p/11011393.html

当然网上还有很多博客也有写java代码实现的简易布隆过滤器,有一些还带有误判率参数的。如:https://blog.csdn.net/aaa_bbb_ccc_123_456/article/details/106055033

不过实际开发还是用Google那个guava。

import java.util.ArrayList;
import java.util.BitSet;
import java.util.List;
 
//这里帮原作者添加一些注释
public class BloomFilter {
    //bitset的默认大小,(2 <<24)为2左移24为,既2*2^24位大小
    private static final int DEFAULT_SIZE =2 <<24;  
    //种子(hash函数用到,使用质数是为了减低误判率)
    private static final int[] seeds =new int[] {5,7,11,13,31,37,61 };
    //比特集
    private BitSet bits =new BitSet(DEFAULT_SIZE);
    //自定义的简易的hash函数数组
    private SimpleHash[] func =new SimpleHash[seeds.length];
 
    public BloomFilter() {
        for (int i =0; i < seeds.length; i++) {
            func[i] =new SimpleHash(DEFAULT_SIZE, seeds[i]);
        }
    }
 	
    //添加一个数据到布隆过滤器(其实就算映射到bit集去)
    public void add(String value) {
        for (SimpleHash f : func) {
            bits.set(f.hash(value),true);
        }
    }
 	
    //判断是否包含该数据
    public boolean contains(String value) {
        if (value ==null) {
            return false;
        }
        boolean ret =true;
        for (SimpleHash f : func) {
            ret = ret && bits.get(f.hash(value));
        }
        return ret;
    }
 
    // 内部类,simpleHash,一个自定义的hash函数
    public static class SimpleHash {
        private int cap;
        private int seed;
 
        public SimpleHash(int cap,int seed) {
            this.cap = cap;
            this.seed = seed;
        }
 		
        //获取hash值(主要通过字符串的每个字符ASCII码值来计算)
        public int hash(String value) {
            int result =0;
            int len = value.length();
            for (int i =0; i < len; i++) {
                result = seed * result + value.charAt(i);
            }
            return (cap -1) & result;
        }
    }

}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值