BloomFilter 布隆过滤器
适合在高并发或大数据下的数据状态判断。
比如缓存穿透下,大量的请求走过redis后发现无数据,又一起奔向数据库,DB会有直接挂掉的可能。重点是,这种情况下数据库其实也没有数据,这些请求完全没必要走到数据库这一层。我们可以将可能存在的数据id或其他标识存入BloomFilter中,请求之后先通过BloomFilter确定是不是可能存在的数据。如果是存在,再继续后面的取数据操作。
使用方法:
1、在redis中使用bloomFilter,redis默认是用不了BloomFilter的,需要安装BloomFilter插件。
这里我因为使用docker,官方有现成的支持了BloomFilter的redis镜像。
docker run -p 6379:6379 --name redis-redisbloom redislabs/rebloom:latest
基本语法:
bf.add 添加元素到过滤器
bf.exists 判断元素是否存在
bf.madd 添加多个元素到过滤器
bf.mexists 判断多个元素是否存在
基于BloomFilter特殊的底层逻辑,并不存在删除操作~
BloomFilter 只有两种操作:
第一种:加元素到BloomFilter中
第二种:判断某个元素是不是存在于BloomFilter中
同样是基于其数据结构的特殊性,如果BloomFilter告诉你某个元素是已经存在的元素。也不一定真的存在。
2、guava 也提供了bloomFilter的实现。
BloomFilter<String> bloomFilter = BloomFilter.create(Funnels.unencodedCharsFunnel(), 100000);
添加:bloomFilter.put("手机");
判断是否存在:boolean r = bloomFilter.mightContain("手机");
总结BloomFilter的特点就是:
1、 只能加数据和查看数据是否存在 ,不能删数据
2、如果BloomFilter告诉你数据存在了,不一定是真的存在,但是判断错误的概率很低。
要搞清楚第二个点需要去了解BloomFilter的原理(实现)。
SpringBoot中调用bloomFilter:
这一块通过lua脚本实现。现有的API似乎没有直接支持对bloomFilter的调用。但是通过调用lua脚本还是能比较轻松的实现
主要涉及到添加数据 和 查找数据 两个操作。所以定义两个lua脚本就行了
--
-- Created by IntelliJ IDEA.
-- User: tangzq
-- Date: 2020/3/02
-- Time: 16:59
-- 判断bloomFilter是否存在某个数据
--
--- 获取value
local val = KEYS[1]
--- 获取过滤名
local filterName = ARGV[1]
--- 判断 并返回操作的结果
return redis.call("BF.EXISTS",filterName,val)
--
-- Created by IntelliJ IDEA.
-- User: tangzq
-- Date: 2020/3/02
-- Time: 16:56
-- 将数据存入布隆过滤器
--
--- 获取value
local val = KEYS[1]
--- 获取过滤名
local filterName = ARGV[1]
--- 将数据存入布隆过滤器
return redis.call("BF.ADD",filterName,val)
上面配置中的参数是我们调用脚本的时候传入的。
下面进行配置。
@Configuration
public class RedisConfig {
@Bean
public DefaultRedisScript<Boolean> addBF() {
DefaultRedisScript<Boolean> redisScript = new DefaultRedisScript<>();
redisScript.setScriptSource(new ResourceScriptSource(new ClassPathResource("bf-insert.lua")));
redisScript.setResultType(Boolean.class);
return redisScript;
}
@Bean
public DefaultRedisScript<Boolean> existsBF() {
DefaultRedisScript<Boolean> redisScript = new DefaultRedisScript<>();
redisScript.setScriptSource(new ResourceScriptSource(new ClassPathResource("bf-exists.lua")));
redisScript.setResultType(Boolean.class);
return redisScript;
}
}
上面声明的两个bean类型相同,一个是调用脚本加数据到BF,一个是判断BF是不是存在某个数据
所以使用的时候应该这样:
@Autowired
@Qualifier("addBF")
private DefaultRedisScript<Boolean> addBF;
@Autowired
@Qualifier("existsBF")
private DefaultRedisScript<Boolean> existsBF;
//必须声明你用的是哪个bean
使用demo
List<String> keys = Arrays.asList(val);
Boolean execute = stringRedisTemplate.execute(addBF, keys, "tzq");
这里是将val添加到名为tzq的bloomFilter中。