Gorilla: A fast, scalable, in-memory time series database
作者: Pelkonen T, Franklin S, Teller J, et al
出处: VLDB(CCF A)
年份: 2015
链接:https://dl.acm.org/doi/pdf/10.14778/2824032.2824078
简介:
- Gorila是Facebook在2015年介绍的内存型时序数据库并开源实现了Beringei。当前较为流行的时序数据库例如InfluxDB、loTDB、Prometheus的压缩算法也参考了Gorilla的相关实现。
- 大规模互联网面对每秒监控和分析千万次的测量当中,往往不太重视单个数据点,而是强调聚合分析。并且最近数据点比旧数据点更具备价值。面对写入和读取的高可用性要求,利用增量时间戳和XOR浮点值将数据压缩存储在内存中,减少查询延迟提升,查询吞吐量。监测系统性能读取存在问题,HBase时间序列存储系统无法扩展处理未来数据量下的读取负载,希望从查询延迟与效率上作为切入点,关注内存中缓存部分。
- 基于现有的浮点压缩,以流式处理的方式解决存储开销问题。介绍了时间戳与数值型的压缩方案,在不同服务器之间提供读取服务,以及如何部署在开源数据库当中。