小白入门IoTDB【数据存储】

先看不同数据库的问题


因此,对于IoTDB提出的需求(或者说IoTDB的特点)集中体现在:

  1. 高速写入
  2. 高压缩比
  3. 高效查询
  4. 对于时间序列的组织管理
  5. 对接大数据生态

那么,本文将会从IoTDB运用的列式存储、存储引擎,Tsfile介绍IoTDB数据存储的相关问题

行式存储 VS 列式存储

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CSWljUj4-1690442392371)(D:\饭饭饭饭\天谋\下载\0f35ff6cc82c458abac8f4a1aa7f5c14.png)]

由上图可以看出行式存储是每一行的所有数据存在一个block中,各个block连续存储,列式存储就是每一列的所有数据存在一起,不同列之间可以分开存储。

对比如下表:

行式存储列式存储
写入插入方便由于每一列单独存储,所以插入修改会繁琐
查询需要读取所有数据,适合随即查询,不适合扫描只读取涉及到的列,缺点在于查询完成时,需要将被查询的列重新组装
空间不利于压缩,占空间大由于把一列数据保存在一起,而一列的数据类型相同,可以为每一列创建一个字典,存储的时候就仅存储数字编码即可,降低了存储空间需求

存储引擎

IoTDB 存储引擎基于 LSM Tree 结构设计,写入的数据先记录 WAL,再写到内存 memtable,在后台逐步刷到磁盘 TsFile;磁盘上的 TsFile 通过一定的规则进行 Compaction,保证查询效率。

LSM树

Log Structured Merge Tree, 一种分层,有序,面向磁盘的数据结构

核心思想:磁盘批量的顺序写要远比随机写性能高出很多

优缺点:大大提升了数据的写入能力,牺牲部分读取性能

应用场景:数据是被整体访问的

WAL

预写式日志(Write-Ahead Log)

在将数据写入内存表之前,首先将其记录到预写式日志中,该日志位于磁盘上。预写式日志的目的是确保数据持久性,并防止在系统故障(例如崩溃、停电)的情况下丢失数据。

memtable

内存表,一种在数据被刷新为SSTables之前临时保存最近写入数据的内存数据结构。

TsFile

时序数据文件(TimeSeriesFile)

ChunkGroup

一个设备一段时间的数据块

Chunk:一个物理量一段时间的数据
Page:一个物理量一段时间的数据

(Page中存具体的数据,Chunk会包含多个Page)

索引结构

序列内

三级结构:Page,Chunk,文件级

序列间

元数据索引树

元数据索引树图示

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值