https://www.infoq.cn/article/condense-in-sequential-databases
我的任务是历史库的存储:原则
1、可以看到各分布式时序数据库虽然存储方案都略有不同,但本质上是一致的,由于时序数据写多读少的场景,在单机上采用更加适合大吞吐量写入的单机存储结构,而在分布式方案上根据时序数据的特点来精心设计,目标就是设计的分片方案能方便时序数据的写入和读取,同时使数据分布更加均匀,尽量避免热点的产生。--https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==&mid=2247486232&idx=1&sn=6563cfb8a316cddc7a8e56f58d173305&source=41#wechat_redirect
2、数据分级存储,热数据、暖数据、冷数据分别存储至内存、SSD和SATA/SAS中。
3、数据压缩,主要采用delta-delta 压缩,这个算法确实非常适合对时序数据的压缩。目测,是snappy压缩的5-10倍。
4、“存储”都是需要持久化的,可以是U盘,硬盘,网盘等等,我们所讲的“计算”其实