如何解决实时历史数据库存储成本问题？

最新推荐文章于 2023-06-08 15:33:10 发布

文宇肃然

最新推荐文章于 2023-06-08 15:33:10 发布

阅读量1.8k

点赞数

分类专栏：人工智能AI实战系列代码全解析数据中台入门到精通系列讲解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wenyusuran/article/details/106897571

版权

人工智能AI实战系列代码全解析同时被 2 个专栏收录

64 篇文章 ¥29.90 ¥99.00

订阅专栏

数据中台入门到精通系列讲解

44 篇文章 ¥19.90 ¥99.00

订阅专栏

本文探讨了实时历史数据库的存储成本问题，提出了阿里云的X-Engine解决方案。X-Engine通过分层存储和高效压缩，显著降低了存储成本。它支持实时查询、低频访问和历史数据更新，适用于大规模历史数据存储场景。文章还介绍了实时历史库的架构设计，包括在线库和历史库的拆分、DTS同步以及DMS的过期数据删除功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实时历史库需求背景

在当今的数字化时代，随着业务的迅速发展，每天产生的数据量会是一个惊人的数量，数据库存储的成本将会越来越大，通常的做法是对历史数据做归档，即将长期不使用的数据迁移至以文件形式存储的廉价存储设备上，比如阿里云OSS或者阿里云数据库DBS服务。

然而在部分核心业务的应用场景下，针对几个月甚至几年前的“旧”数据依旧存在实时的，低频的查询甚至更新需求，比如淘宝/天猫的历史订单查询，企业级办公软件钉钉几年前的聊天信息查询，菜鸟海量物流的历史物流订单详情等。

如果这时从历史备份中还原后查询，那么查询时间将会是以天为单位，可接受度为0

如果将这些低频但实时的查询需求的历史数据与近期活跃存储在同一套分布式数据库集群下，那么又会带来以下两大挑战

存储成本巨大，进而导致成本远大于收益，比如钉钉聊天信息数据量在高度压缩后接近50PB，很难想象这些数据不做压缩会带来多大的资金开销
性能挑战巨大，随着数据量越来越大，即使针对数据做了分布式存储，单实例容量超过大概5T以后性能也会急剧下滑，进而影响到近期活跃数据的查询性能，拖垮整个集群
运维难度巨大，比如针

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

文宇肃然 精神和物质鼓励你选一个吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。