32.4 prometheus存储磁盘数据结构和存储参数

本节重点介绍 :

  • prometheus存储磁盘数据结构介绍
    • index
    • chunks
    • head chunks
    • Tombstones
    • wal
  • prometheus对block进行定时压实 compact
  • prometheus 查看支持的存储参数

prometheus存储示意图

prome_tsdb_01.jpg

内存和disk之间的纽带 wal

  • WAL目录中包含了多个连续编号的且大小为128M的文件,Prometheus称这样的文件为Segment,其中存放的就是对内存中series以及sample数据的备份。
  • 另外还包含一个以checkpoint为前缀的子目录,由于内存中的时序数据经常会做持久化处理,WAL中的数据也将因此出现冗余
  • 所以每次在对内存数据进行持久化之后,Prometheus都会对部分编号靠后的Segment进行清理。但是我们并没有办法做到恰好将已经持久化的数据从Segment中剔除,也就是说被删除的Segment中部分的数据依然可能是有用的。所以在清理Segment时,我们会将肯定无效的数据删除,剩下的数据就存放在checkpoint中。而在Prometheus重启时,应该首先加载checkpoint中的内容,再按序加载各个Segment的内容。
  • 最后,series和samples以Record的形式被批量写入Segment文件中,默认当Segment超过128M时,会创建新的Segment文件。若Prometheus因为各种原因崩溃了,WAL里的各个Segment以及checkpoint里的内容就是在崩溃时刻Prometheus内存的映像。Prometheus在重启时只要加载WAL中的内容就能完全"恢复现场"。

磁盘数据结构

promethues 磁盘数据结构

prome_tsdb_disk_01.png

prome_tsdb_disk_02.png

Index Disk Format

  • 文档地址 https://github.com/prometheus/prometheus/blob/release-2.26/tsdb/docs/format/index.md

Chunks

  • 下面介绍块文件的格式,该文件在chunks/块目录中创建。每个段文件的最大大小为512MiB。
  • 文档地址 https://github.com/prometheus/prometheus/blob/release-2.26/tsdb/docs/format/chunks.md

head chunks

  • 文档地址 https://github.com/prometheus/prometheus/blob/release-2.26/tsdb/docs/format/head_chunks.md

Tombstones

  • prometheus 删除数据/admin/tsdb/delete_series
  • tombstones用于存储对于series的删除记录。如果删除了某个时间序列,Prometheus并不会立即对它进行清理,而是会在tombstones做一次记录,等到下一次Block压缩合并的时候统一清理。prome_tsdb_disk_tombstone.png
  • 文档地址 https://github.com/prometheus/prometheus/blob/release-2.26/tsdb/docs/format/tombstones.md

wal

  • 文档地址 https://github.com/prometheus/prometheus/blob/release-2.26/tsdb/docs/format/wal.mdprome_tsdb_disk_series.png
  • prome_tsdb_disk_sample.png
  • 该预写日志在编号和顺序,如段工作000000,000001,000002等,在默认情况下被限制为128MB
  • 段写入到32KB的页面中。仅最近段的最后一页可能是不完整的
  • WAL记录是一个不透明的字节片,如果超过当前页面的剩余空间,它将被分成子记录。记录永远不会跨段边界拆分
  • 如果单个记录超过了默认的段大小,则将创建一个更大的段。页面的编码很大程度上是从LevelDB / RocksDB的预写日志中借用的。

prometheus对block进行定时压实 compact

压实的作用

  • 标记删除
  • Compaction主要操作包括合并block、删除过期数据、重构chunk数据
  • 其中合并多个block成为更大的block,可以有效减少block个数,当查询覆盖的时间范围较长时,避免需要合并很多block的查询结果。
  • 为提高删除效率,删除时序数据时,会记录删除的位置,只有block所有数据都需要删除时,才将block整个目录删除,因此block合并的大小也需要进行限制,

访问prometheus flags api 查看支持的存储参数

参数名含义默认值说明
storage.remote.flush-deadline在关闭或配置重新加载时等待存储刷盘的时间1分钟可以依据数据量调整
storage.remote.read-concurrent-limit远程读取调用的并发qps, 0表示没有限制。10保护后端存储,避免被高并发打垮
storage.remote.read-max-bytes-in-frame远程读取流中,在解码数据前,单个帧中的最大字节数。请注意,客户端也可能会限制帧大小。默认为protobuf建议的1MB。1M保护后端存储,避免被高并发打垮
storage.remote.read-sample-limit在单个查询中要通过远程读取接口返回的最大样本总数。 0表示没有限制。对于流式响应类型,将忽略此限制。10保护后端存储,避免被高并发打垮
storage.tsdb.allow-overlapping-blocks允许重叠的块,从而启用垂直压缩和垂直查询合并false
storage.tsdb.max-block-duration压实块的时间范围上限 用于测试。(默认为保留期的10%。)
storage.tsdb.min-block-duration数据块在保留之前的最小持续时间。用于测试。
storage.tsdb.no-lockfile不要在数据目录中创建锁文件。false
storage.tsdb.path数据目录path默认为进程运行目录的data
storage.tsdb.retention.time保存样品的时间。当设置此标志时,它将覆盖“storage.tsdb.retention”。如果既没有这个标志,也没有“storage.tsdb”。保留”也不“storage.tsdb.retention。设置大小,保留时间默 认为15d。支持单位:y, w, d, h, m, s, ms。保留时间默 认为15d
storage.tsdb.retention.size大小[实验]块可以存储的最大字节数。需要一个单位,支持单位:B, KB, MB, GB, TB, PB, EB。例:“512 mb”。这个标志是实验性的,可以在以后的版本中更改
storage.tsdb.wal-compression开启wal snappy压缩true
storage.tsdb.wal-segment-sizewal文件大小默认128M

本节重点总结 :

  • prometheus存储磁盘数据结构介绍
    • index
    • chunks
    • head chunks
    • Tombstones
    • wal
  • prometheus对block进行定时压实 compact
  • prometheus 查看支持的存储参数
Prometheus时序数据库的磁盘中的存储结构主要是通过block合并WAL预写日志的方式来实现数据的持久化保护。数据在内存中保存最近的数据,并通过一个compactor定时将数据打包到磁盘。为了防止数据丢失,Prometheus实现了WAL机制,即以写入日志的方式来实现数据的重播恢复。\[1\]\[2\] 在磁盘中,Prometheus的数据以block的形式存储。一般情况下,写入的数据不会再发生变动。如果需要删除部分数据,Prometheus会记录下删除数据的范围,并在下一次compactor组成新block的时候进行删除。这些删除信息被记录在tomstones文件中。\[3\] 总结来说,Prometheus时序数据库的磁盘中的存储结构通过block合并WAL预写日志的方式来保证数据的持久化防止数据丢失,并通过compactor来管理数据的打包删除。 #### 引用[.reference_title] - *1* [时序数据库的存储结构](https://blog.csdn.net/Mountainest/article/details/117882100)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [【博客479】prometheus-----时序数据模型及其存储机制](https://blog.csdn.net/qq_43684922/article/details/126689923)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Prometheus时序数据库-磁盘中的存储结构](https://blog.csdn.net/yangjianrong1985/article/details/114381438)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

福大大架构师每日一题

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值