数据特点:
1.数据量大,之作插入,很少更新
2.通过流计算的方式获取,均拥有时间戳
业务需求
针对数据进行统计分析
对选型的要求
经过上面的数据特点和业务需求,总结对存储选型的要求
1.支持数据压缩,节约存储空间
2.支持数据的分片或分区,同时支持水平扩展和垂直扩展
3.由于需要在StormBolt中进行数据插入,所以插入性能一定要高
4.对时间段类型的查询一定要快
5.可以自动的扩展分片或分区,比如:每到新的一周,自动创建下一周的分区
6.有索引机制,除了时间查询外可以对业务标签字段进行索引
7.有丰富的数据类型支持
8.有丰富的聚合函数供我们使用
9.最好支持SQL和JDBC
10.可以简单的完成历史数据的转存。当然如果支持无限量存储当然更好,但这也是不可能的。
现在的技术备选方案包括:Druid、TimescaleDB