redis的价值:
1、提升数据的查询效率
2、解决锁的问题
3、保护数据库的目的
1、缓存穿透(db无数据)
描述:
是指查询一个不存在的数据,由于缓存无法命中,将去查询数据库,但是数据库也无此记录,并且出于容错考虑,我们没有将这次查询的null写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就是漏洞。
方案:
1:存入空数据
往redis中存入一个空对象。设置的过期时间一点要短(建议在5分钟内)。
注意:
一般的编码习惯,就是拿上reids中的数据直接进行类型转换。如果是new Object();之一类型转换异常。
2:使用布隆过滤器(可以检索一个元素是否在一个集合中)
布隆过滤器是一个bit向量或者bit,如果我们要映射一个值到布隆过滤器中,我们使用多个不同的哈希函数生成多个哈希值,并将每个生成的哈希值指向的bit位设置为1,如下baidu一词设置了三个位置为1。
2.1原理:
对一个key进行k个hash算法获取k个值,在比特数组中将这k个值散列后设定为1,然后查的时候如果特定的这几个位置都为1,那么布隆过滤器判断该key存在。
“tencent”一词,对应的情况
可以看到,不同的词对应的bit位置可能相同,当词很多的情况时,可能大部分bit位置都是1,这时查询taobao可能对应的位置都为1,只能说明taobao一词可能存在,不是一定存在的,这时1就被覆盖了,这就是布隆过滤器的误判。如果它说不存在那肯定不存在,如果它说存在,那数据有可能实际不存在。
2.2布隆过滤器的优缺点:
优点:
1、
由于存储的是二进制数据,所以占用的空间很小
2、
它的插入和查询速度是非常快的,时间复杂度是O(K),空间复杂度:O (M)。
K: 是哈希函数的个数
M: 是二进制位的个数
3、保密性很好,因为本身不存储任何原始数据,只有二进制数据
缺点:
1、由于有hash冲突,所以存在误判率
误判率的影响因素:数据规模n,hash函数个数k,数据规模m
2、删除困难,hash冲突,不清楚要删除哪一个数据。
Redis的bitmap只支持2^32大小,对应到内存也就是512MB,误判率万分之一,可以放下2亿左右的数据,性能高,空间占用率及小,省去了大量无效的数据库连接。
因此我们可以通过布隆过滤器,将Redis缓存穿透控制在一个可容范围内。
使用布隆过滤器:
导入依赖
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>19.0</version>
</dependency>
代码:
public class Test {
private static int size = 1000000;//预计要插入多少数据
private static double fpp = 0.01;//期望的误判率
private static BloomFilter<Integer> bloomFilter = BloomFilter.create(Funnels.integerFunnel(), size, fpp);
public static void main(String[] args) {
//插入数据
for (int i = 0; i < 1000000; i++) {
bloomFilter.put(i);
}
int count = 0;
for (int i = 1000000; i < 2000000; i++) {
if (bloomFilter.mightContain(i)) {
count++;
System.out.println(i + "误判了");
}
}
System.out.println("总共的误判数:" + count);
}
}
应用:
@Cacheable(value="key1")
public String get(String key) {
String value = redis.get(key);
// redis中不存在该缓存
if (value == null) {
//布隆过滤器也没有,直接返回
if(!bloomfilter.mightContain(key)){
return null;
}else{
//布隆过滤器中能查到,不代表一定有,查出来放入redis,同样也可以避免缓存穿透
value = db.get(key);
redis.set(key, value);
}
}
return value;
}
2、缓存穿透(单key失效-->db有数据)
描述:
是指对于一些设置了过期时间的key,如果这些key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:如果这个key在大量请求同时进来之前正好失效,那么所有对这个key的数据查询都落到db,我们称为缓存击穿。
方案:
利用锁解决问题。锁分为:本地锁和分布式锁,本地锁适用于单体的项目中,
分布式锁:
1、效率最高:redis
2、安全系数最高:zookeeper
3、数据库
3、缓存雪崩(多key同时失效)
描述:
是指在我们设置缓存时采用了相同的过期时间,导致缓存在某一时刻大量的key同时失效,请求全部转发到DB,DB瞬时压力过重雪崩。导致服务宕机。
方案:
给key设置随机的过期时间。