存储引擎(Timestamp-Structure Merge Tree)
TSM 主要由四部分组成:cache、wal、tsm file、compactor
- cache:插入数据时,先往 cache 中写入,再写入到 wal 中,可以认为 cache 是 wal 文件中的数据在内存中的缓存,cache 中的数据并不是无限增长的,有一个
maxsize
参数用于控制当 cache 中的数据占用多少内存后就会将数据写入 tsm 文件,如果不配置的话,默认上限是 25M。 - wal:预写日志,对比 Mysql中的 binlog ,其内容与内存中的cache 相同,作用就是为了持久化数据,当系统奔溃后可以通过 wal 文件恢复还没有写入到 tsm 文件中的数据,当 influxDB 启动时,会遍历所有的 wal 文件,重新构造 cache。
wal 单个文件达到一定大小后会进行分片,创建一个新的 wal 分片文件用于写入数据。 - tsm file:每个 tsm 文件大小上限是 2GB,当达到
cache-snapshort-memory-size,cache-max-memory-size
的限制时会触发将 cache 写入到 tsm 中。 - compactor:主要进行两种操作,一种是 cache 数据达到阈值后,进行快照,生成一个新的 tsm 文件。另外一种就是合并当前的 tsm 文件,将多个小的 tsm 文件合并成一个,减少文件的数量,并且进行一些数据删除操作。这些操作都在后台完成,一般每隔一秒会检查一次是否有需要压缩合并的数据。
存储目录
influxDB 的数据存储有三个目录: meta、wal、data
- meta:用于存储数据库的一些元数据,meta 目录下有一个 meta.db文件
- wal:存放预写日志文件,以 .wal 结尾
- data:存放实际存储的数据文件,以 .tsm 结尾