打造“云边一体化”，时序时空数据库TSDB技术原理深度解密

最新推荐文章于 2024-06-02 22:23:07 发布

阿里云技术

最新推荐文章于 2024-06-02 22:23:07 发布

阅读量484

点赞数

文章标签：阿里云数据库

本文链接：https://blog.csdn.net/weixin_43970890/article/details/102663698

版权

本文选自云栖大会下一代云数据库分析专场讲师自修的演讲——《TSDB云边一体化时序时空数据库技术揭秘》
自修 —— 阿里云智能数据库产品事业部高级专家

认识TSDB

第一代时序时空数据处理工具虽然通用关系数据库可以存储时序数据，但是由于缺乏针对时间的特殊优化，比如按时间间隔存储和检索数据等等，因此在处理这些数据时效率相对不高。第一代时序数据典型来源于监控领域，直接基于平板文件的简单存储工具成为这类数据的首先存储方式。以RRDTool，Wishper为代表，通常这类系统处理的数据模型比较单一，单机容量受限，并且内嵌于监控告警方案。

第二代面向时序时空领域的数据库伴随着大数据和Hadoop的发展，时序数据量开始迅速增长，系统业务对于处理时序数据的扩展性等方面提出更多的要求。基于通用存储而专门构建的时间序列数据库开始出现，它可以按时间间隔高效地存储和处理这些数据。像OpenTSDB，KairosDB等等。

这类时序数据库在继承通用存储优势的基础上，利用时序的特性规避部分通用存储的劣势，并且在数据模型，聚合分析方面做了贴合时序的大量创新。比如OpenTSDB继承了HBase的宽表属性结合时序设计了偏移量的存储模型，利用salt缓解热点问题等等。然而它也有诸多不足之处，比如低效的全局UID机制，聚合数据的加载不可控，无法处理高基数标签查询等等。随着docker，kubernetes, 微服务等技术的发展，以及对于IoT的发展预期越来越强烈。

在数据随着时间而增长的过程中，时间序列数据成为增长最快的数据类型之一。高性能，低成本的垂直型时序数据库开始诞生，以InfluxDB为代表的具有时序特征的数据存储引擎逐步引领市场。它们通常具备更加高级的数据处理能力，高效的压缩算法和符合时序特征的存储引擎。比如InfluxDB的基于时间的TSMT存储，Gorilla压缩，面向时序的窗口计算函数p99，rate，自动rollup等等。同时由于索引分离的架构，在膨胀型时间线，乱序等场景下依然面临着很大的挑战。

第三代云时序时空数据库从2016年开始，各大云厂商纷纷布局TSDB，2017.4 Microsoft发布时序见解预览版，提供的完全托管、端到端的存储和查询高度情景化loT时序数据解决方案。强大的可视化效果用于基于资产的数据见解和丰富的交互式

最低0.47元/天解锁文章

阿里云技术

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
打造“云边一体化”，时序时空数据库TSDB技术原理深度解密

本文选自云栖大会下一代云数据库分析专场讲师自修的演讲——《TSDB云边一体化时序时空数据库技术揭秘》自修 —— 阿里云智能数据库产品事业部高级专家认识TSDB第一代时序时空数据处理工具虽然通用关系数据库可以存储时序数据，但是由于缺乏针对时间的特殊优化，比如按时间间隔存储和检索数据等等，因此在处理这些数据时效率相对不高。第一代时序数据典型来源于监控领域，直接基于平板文件的简单...
复制链接

扫一扫