全文约3882字,阅读约24分钟
CirroData数据库针对大数据量的高并发点查询场景,为了更大程度降低查询响应时间,首创性地把缓存机制融合到当前的动态指令生成引擎中,因此动态指令生成引擎之高性能缓存技术(以下简称为高性能缓存技术)应运而生。接下来,让我们进入今天的主题。
1.为什么使用高性能缓存技术?
动态指令生成引擎通过在程序运行期间动态生成代码,并编译成目标平台的二进制代码,从而达到计算处理逻辑的高效性。动态代码的平均编译时间约为70ms,当我们从应用端向CirroData进行点查询时,由于语句处理时间为毫秒级,若同时存在大量用户同时从应用端进行查询时,那么上面提到的动态代码编译时间就凸显出了部分性能影响。
考虑到通常情况下高并发的点查询场景,处理着大量相同规格的表达式这一特点,我们通过缓存实现JIT函数[1]一次编译、多次执行,从而达到提高TPS[2]、降低响应时间的目的。高性能缓存技术—将JIT函数以及LLVM ExecutionEngine[3]执行引擎一并进行缓存,实现JIT函数的一次编译、多次执行。下面简单说明一下,ExecutioinEngine执行引擎的作用,以及为什么需要缓存?
![0cefa710f7acc9806e26204e781a4385.gif](https://i-blog.csdnimg.cn/blog_migrate/a53a9d13ea2e3b2701130a3310501583.gif)
即时编译主要分为代码组装、代码编译两个阶段。代码组装:程序运行时,将动态生成的代码写入到ExecutionEngine内部的核心Module[4]中进行缓存。代码编译:ExecutionEngine将Module中缓存的动态代码编译成目标平台可执行的二进制代码。LLVM ExecutionEngine内部结构图如下:
![7fb89f844538e8fa006083772b9e61dd.png](https://i-blog.csdnimg.cn/blog_migrate/11b99f3988581a114d879282dba66334.png)
通过EngineBuilder创建出ExecutionEngine执行引擎。ExecutionEngine内部创建出MCJIT,然后通过MCJIT将Module中存放的平台无关的IR代码,根据指定的TargetMachine即时编译成对应平台的机器码,最后通过RTDyldMemoryManager在运行时进行内存管控和映射,使得编译的机器码真实可用。上述流程简单示意图如下:
![661f8dbc70305e5f5c4c0e3208fb8e39.png](https://i-blog.csdnimg.cn/blog_migrate/b191fde9da884ab78f12db1339cb6b84.png)
从上面简单的示意图中