作者:vivo 互联网服务器团队- Wang Zhi
Caffeine 作为一个高性能的缓存框架而被大量使用。本文基于Caffeine已有的基础进行定制化开发实现可视化功能。
一、背景
Caffeine缓存是一个高性能、可扩展、内存优化的 Java 缓存库,基于 Google 的 Guava Cache演进而来并提供了接近最佳的命中率。
Caffeine 缓存包含以下特点:
- 高效快速:Caffeine 缓存使用近似算法和并发哈希表等优化技术,使得缓存的访问速度非常快。
- 内存友好:Caffeine 缓存使用一种内存优化策略,能够根据需要动态调整缓存的大小,有效地利用内存资源。
- 多种缓存策略:Caffeine 缓存支持多种缓存策略,如基于容量、时间、权重、手动移除、定时刷新等,并提供了丰富的配置选项,能够适应不同的应用场景和需求。
- 支持异步加载和刷新:Caffeine 缓存支持异步加载和刷新缓存项,可以与 Spring 等框架无缝集成。
- 清理策略:Caffeine 使用 Window TinyLFU 清理策略,它提供了接近最佳的命中率。
- 支持自动加载和自动过期:Caffeine 缓存可以根据配置自动加载和过期缓存项,无需手动干预。
- 统计功能:Caffeine 缓存提供了丰富的统计功能,如缓存命中率、缓存项数量等,方便评估缓存的性能和效果。
正是因为Caffeine具备的上述特性,Caffeine作为项目中本地缓存的不二选择,越来越多的项目集成了Caffeine的功能,进而衍生了一系列的业务视角的需求。
日常使用的需求之一希望能够实时评估Caffeine实例的内存占用情况并能够提供动态调整缓存参数的能力,但是已有的内存分析工具MAT需要基于dump的文件进行分析无法做到实时,这也是整个事情的起因之一。
二、业务的技术视角
- 能够对项目中的Caffeine的缓存实例能够做到近实时统计,实时查看缓存的实例个数。
- 能够对Caffeine的每个实例的缓存配置参数、内存占用、缓存命中率做到实时查看,同时能够支持单个实例的缓存过期时间,缓存条目等参数进行动态配置下发。
- 能够对Caffeine的每个实例的缓存数据做到实时查看,并且能够支持缓存数据的立即失效等功能。
基于上述的需求背景,结合caffeine的已有功能和定制的部分源码开发,整体作为caffeine可视化的技术项目进行推进和落地。
三、可视化能力
Caffeine可视化项目目前已支持功能包括:
- 项目维度的全局缓存实例的管控。
- 单缓存实例配置信息可视化、内存占用可视化、命中率可视化。
- 单缓存实例的数据查询、配置动态变更、缓存数据失效等功能。
3.1 缓存实例的全局管控
说明:
- 以应用维度+机器维度展示该应用下包含的缓存实例对象,每个实例包含缓存设置中的大小、过期策略、过期时间、内存占用、缓存命中率等信息。
- 单实例维度的内存占用和缓存命中率支持以趋势图进行展示。
- 单实例维度支持配置变更操作和缓存查询操作。
3.2 内存占用趋势
说明:
- 内存占用趋势记录该缓存实例对象近一段时间内存占用的趋势变化。
- 时间周期目前支持展示近两天的数据。
3.3 命中率趋势
说明:
- 命中率趋势记录该缓存实例对象近一段时间缓存命中的变化情况。
- 时间周期目前支持展示近两天的数据。
3.4 配置变更
说明:
- 配置变更目前支持缓存大小和过期时间的动态设置。
- 目前暂时支持单实例的设置,后续会支持全量生效功能。
3.5 缓存查询
说明:
- 单实例维度支持缓存数据的查询。
- 目前支持常见的缓存Key类型包括String类型、Long类型、Int类型。
四、原理实现
4.1 整体设计框架
Caffeine框架功能整合
说明:
- 沿用Caffeine的基础功能包括Caffeine的缓存功能和Caffeine统计功能。
- 新增Caffeine内存占用预估功能,该功能主要是预估缓存实例对象占用的内存情况。
- 新增Caffeine实例命名功能,该功能是针对每个实例对象提供命名功能,是全局管控的基础。
- 新增Caffeine实例全局管控功能,该功能主要维护项目运行中所有的缓存实例。
Caffeine可视化框架
说明:
- 【项目工程侧】:Caffeine的可视化框架基于Caffeine框架功能整合的基础上增加通信层进行数据数据上报和配置的下发。
- 【管控平台侧】:负责缓存数据上报的接收展示,配置变更命令的下发。
- 【通信层支持push和pull两种模式】,push模式主要用于统计数据的实时上报,pull模式主要用于配置下发和缓存数据查询。
4.2 源码实现
业务层-缓存对象的管理
说明:
- 在Caffeine实例创建的基础上增加了缓存实例的命名功能,通过.applyName("accountWhiteCache")来定义缓存实例的命名。
说明:
- 每个Caffeine都有一个实例名称instanceName。
- 全局通过cacheInstanceMap来维护Caffeine实例对象的名称和实例的映射关系。
- 通过维护映射关系能够通过实例的名称查询到缓存实例对象并对缓存实例对象进行各类的操作。
- Caffeine实例的命名功能是其他功能整合的基石。
业务层-内存占用的预估
说明:
- 通过ObjectSizeCalculator.getObjectSize预估内存的缓存值。
- data值是Caffeine实例用来保存真实数据的对象。
业务层-数据上报机制
说明:
- 通过Caffeine自带的统计接口来统计相关数值。
- 统计数据实例维度进行统计。
说明:
- 通过获取项目中运行的所有Caffeine实例并依次遍历收集统计数据。
- 通过http协议负责上报对应的统计数据,采用固定间隔周期进行上报。
业务层-配置动态下发
说明:
- 通过Caffeine自带接口进行缓存配置的相关设置。
业务层-缓存数据清空
业务层-缓存数据查询
说明:
- 通过Caffeine自带接口进行缓存信息查询。
通信层-监听服务
说明:
- 通信层通过jetty启动http服务进行监听,安全考虑端口不对外开放。
- 通过定义ClientServlet来处理相关的请求包括配置下发和缓存查询等功能。
通信层-心跳设计
说明:
- 心跳功能上报项目实例的ip和端口用来通信,携带时间戳用来记录上报时间戳。
- 实际项目中因为机器的回收等场景需要通过上报时间戳定时清理下线的服务。
五、总结
vivo技术团队在Caffeine的使用经验上曾有过多次分享,可参考公众号文章《如何把 Caffeine Cache 用得如丝般顺滑》,此篇文章在使用的基础上基于使用痛点进行进一步的定制。
目前Caffeine可视化的项目已经在相关核心业务场景中落地并发挥作用,整体运行平稳。使用较多的功能包括项目维度的caffeine实例的全局管控,单实例维度的内存占用评估和缓存命中趋势评估。
如通过单实例的内存占用评估功能能够合理评估缓存条目设置和内存占用之间的关系;通过分析缓存命中率的整体趋势评估缓存的参数设置合理性。
期待此篇文章能够给业界缓存使用和监控带来一些新思路。