Cassandra数据库从入门到精通系列之三:Cassandra数据存储格式

68 篇文章 10 订阅 ¥39.90 ¥99.00
本文详细探讨了Cassandra的数据存储结构,包括CommitLog的持久化机制,Memtable如何将内存数据批量写入磁盘,以及SSTable的Read Only特性,以及其在数据检索中的Bloom Filter应用和compaction过程的作用,如垃圾回收和提高读操作效率。
摘要由CSDN通过智能技术生成

Cassandra数据库从入门到精通系列之三:Cassandra数据存储格式

一、Cassandra数据

Cassandra的数据包括在内存中和磁盘中的数据

这些数据主要分为三种:

  • CommitLog:主要记录客户端提交过来的数据以及操作。这种数据被持久化到磁盘中,方便数据没有被持久化到磁盘时可以用来恢复。
  • Memtable:用户写的数据在内存中的形式。另外一种形式是BinaryMemtable,这个格式目前Cassandra并没有使用。
  • SSTable:数据被持久化到磁盘,又分为Data、Index和Filter三种数据格式。

二、CommitLog数据格式

  • Cassandra在写数据之前,需要先记录日志,保证Cassandra在任何情况下宕机都不会丢失数据。这就是CommitLog日志。
  • 要写入的数据按一定格式组成byte数组,写到IO缓冲区中定时被刷到磁盘中持久化。Commitlog是server级别的。每个Commitlog文件的大小是固定的,称之为一个CommitlogSegment。
  • 当一个Commitlog文件写满以后,会新建一个文件。当旧的Commitlog文件不再需要时,会自动清除。

三、Memtable内存中数据结构

  • 数据写入的第二个阶段,MemTable是一种内存结构,当数据量达到块大小时,将批量flush到磁盘上,存储为SSTable。
  • 优势在于将随机IO写变成顺序IO写,降低大量的写操作对于存储系统的压力。
  • 每一个columnfamily对应一个memtable。也就是每一张表对应一个。
  • Memt
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

最笨的羊羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值