存储
文章平均质量分 92
菜鸟棒
这个作者很懒,什么都没留下…
展开
-
Hadoop 生态认知
HDFS不适合交互场景;大吞吐量;HBaseKey-Value Store, 适合存储半结构化数据,例如: 图片数据 ;对于同一个key, Value可以具有多个列column, 每个列可以具有不同时间纬度下的值,也就是说可以拿到某个key 对应value随时间变化的值;HBase适合大数据场景存储,数据量要足够大, PB级别;Nosql数据库,不支持sql 作为查询语言;强一致性...原创 2020-04-06 16:20:25 · 161 阅读 · 0 评论 -
各类数据库使用场景比较
clickhouse数据采用列式存储,其具有以下特点:适合OLAP(on line analytical process)场景;大多数为读请求;数据批量写入;没有完整的事务支持;修改与删除数据能力不足;OLAP VS OLTPOLTP(on line transaction process)场景, 适合该场景的数据库:mysql 等OLAP(on line analytical ...原创 2020-04-06 16:19:32 · 6955 阅读 · 0 评论 -
Influxdb 知识总结(4)-- seriesfile
查询过程1 索引: measurement/tagkey/tagvalue ---------> series ID2 series file : series ID -------> series key3 TSM: series key --------> 读取对应的数据...原创 2020-03-19 21:59:27 · 869 阅读 · 0 评论 -
influxdb知识总结(3)
Memory-Based IndexseriesByTagKeyValue: map<tagkey, map<tagValue, List< seriesID > > >seriesByID: map< seriesID, *series>Disk-Based Indexinfluxdb中的倒排索引与时序数据都使用了相同的存储机制——LSM...原创 2019-11-18 17:19:18 · 377 阅读 · 0 评论 -
influxdb知识总结(2)--- influxdb 中的重要概念
RP(Retention Policy)RP是数据库级别,核心作用:1 指定数据的过期时间2 指定数据副本数量3 指定shardgroup durationshardgroup每个shardgroup中包含多个shard,每个shardgroup只存储指定时间段的数据。shardgroup起到的作用是将时序数据按时间分区,便于根据时间纬度选择目标数据分区。shardshard是i...原创 2019-11-18 10:13:09 · 905 阅读 · 0 评论 -
influxdb知识总结(1)---背景知识
LSMLSM优化了数据库写性能,而因此弱化了数据库的读性能。在某些应用场景下,对写性能要求较高,而对读性能要求不高。此外,可以通过优化缓存的方式来提高数据库的读性能,并且硬件上内存的提升很容易带来读性能的提高。LSM的实现逻辑就是已经写好的文件不再修改,更新操作只会写入新的文件中(计算机硬盘或SSD顺序写很快,而随机写则很慢,这样可以最多化提升写性能)。写入的每个文件是内部有序的(也就是SST...原创 2019-11-17 17:08:07 · 327 阅读 · 0 评论