1. 缓存的基本原理和应用场景
根据数据的使用频率和方式分类
- 静态数据:一般不变,类似于字典表
- 准静态数据:变化频率很低,部门结构设置,全国行政区划数据等
- 中间状态数据:一些计算的可复用中间数据,变量副本,配置中心的本地副本
- 热数据:使用频率高
- 读写比较大:读的频率 >> 写的频率
这些数据适合于使用缓存的方式访问 广义上来说,为了加速数据处理,让业务更快访问的临时存放冗余数据,都是缓存 狭义上,现在我们一般在分布式系统里把缓存到内存的数据叫做内存缓存
缓存无处不在
内存 ~ 可以看做是 CPU 和 磁盘之间的缓存 CPU 与内存的处理速度也不一致,出现 L1&L2 Cache 网络处理,数据库引擎的各种 Buffer,都可以看做是缓存 GUI 的 Double Buffer(双缓冲),是一个经典的性能优化方法
缓存的本质: 系统各级处理速度不匹配,导致利用空间换时间
缓存是提升系统性能的一个简单有效的办法
缓存三要素
容量 加载 淘汰
2. 缓存常见的问题和应对策略
缓存加载时机
1、启动全量加载 ==> 全局有效,使用简单
2、懒加载
同步使用加载 ==>
- 先看缓存是否有数据,没有的话从数据库读取
- 读取的数据,先放到内存,然后返回给调用方
延迟异步加载 ==>
- 从缓存获取数据,不管是否为空直接返回 ==>
- 策略1异步)如果为空,则发起一个异步加载的线程,负责加载数据
- 策略2解耦)异步线程负责维护缓存的数据,定期或根据条件触发更新
缓存的有效性与数据同步
一般变动频率大,一致性要求高的数据,不太适合用缓存
变化大,意味着缓存数据与原始数据一直有差异;一致性要求高,意味着只有使用原始数据,甚至加了事物才是保险的。
缓存的有效性
读写比:对数据的写操作导致数据变动,意味着维护成本。
命中率:命中缓存意味着缓存数据被使用,意味着有价值。
缓存穿透
问题:大量并发查询不存在的 KEY,导致都直接将压力透传到数据库。
分析:为什么会多次透传呢?不存在一直为空。
需要注意让缓存能够区分 KEY 不存在和查询到一个空值。
解决办法:
1、缓存空值的 KEY,这样第一次不存在也会被加载会记录,下次拿到有这个 KEY。
2、Bloom 过滤或 RoaringBitmap 判断 KEY 是否存在。
3、完全以缓存为准,使用 延迟异步加载 的策略2,这样就不会触发更新。
缓存击穿
问题:某个 KEY 失效的时候,正好有大量并发请求访问这个 KEY。
分析:跟前面一个其实很像,属于比较偶然的。
解决办法:
1、KEY 的更新操作添加全局互斥锁。
2、完全以缓存为准,使用 延迟异步加载 的策略2,这样就不会触发更新。
缓存雪崩
问题:当某一时刻发生大规模的缓存失效的情况,会有大量的请求进来直接打到数据库,导致数 据库压力过大甚至宕机。
分析:一般来说,由于更新策略、或者数据热点、缓存服务宕机等原因,可能会导致缓存数据同 一个时间点大规模不可用,或者都更新。所以,需要我们的更新策略要在时间上合适,数据要均匀分散,缓存服务器要多台高可用。
解决办法:
1、更新策略在时间上做到比较均匀。
2、使用的热数据尽量分散到不同的机器上。
3、多台机器做主从复制或者多副本,实现高可用。
4、实现熔断限流机制,对系统进行负载能力控制。
3. 从本地缓存走向分布式缓存
本地缓存
最简单的本地缓存
public static final Map<String, Object> CACHE = new HashMap();
CACHE.put(“china”, “1000”);
String area = (String) CACHE.get(“china”);
Hibernate/MyBatis 都有 Cache
一级缓存,session 级别。
二级缓存,sessionFactory 级别。
Guava Cache
Cache<String,String> cache = CacheBuilder.newBuilder().maximumSize(1024).expireAfterWrite(60,TimeUnit.SECONDS).weakValues().build();
cache.put("word","Hello Guava Cache");
System.out.println(cache.getIfPresent("word"));
此外,还可以显式清除、统计信息、移除事件的监听器、自动加载等功能。
Spring Cache
1、基于注解和 AOP,使用非常方便
2、可以配置 Condition 和 SPEL,非常灵活
3、需要注意:绕过 Spring 的话,注解无效 核心功能:@Cacheable、@CachePut、@CacheEvict
缺点:
1、在多个集群环境同步?当集群规模增大,缓存的读写放大。
2、在 JVM 中长期占用内存?如果是堆内存,总是会影响 GC。
3、缓存数据的调度处理,影响执行业务的线程,抢资源。
== > 集中处理缓存
分布式缓存
Redis/Memcached 缓存中间件