GBase 8a MPP Cluster 核心技术之列存储

一、数据在磁盘中按照列的方式进行组织和物理存储。

• 表的每一列物理上分开存储
• 数据以DC(数据单元)为单位进行组织,存成DC文件
• DC文件依据操作系统的文件大小限制进行分裂和存储
• DC是基本I/O单位,只有查询所涉及到的列才产生I/O
• 每个DC包含65536行数据,数据行数不足时以DC尾块形式单独存放。
• DC尾块不封装、不压缩。

二、面对海量数据分析的 I/O 瓶颈,分析型数据库把表数据按列的方式存储,其优势体现在以下几个方面。

• 降低 I/O:只有访问查询所涉及的列产生 I/O,查询没有涉及的列不需要访问,不产生 I/O;
• 高压缩比:压缩比可以达到 1:2 ~ 1:20 以上;
• 支持行列混存,降低 select *场景下的 I/O 量提升性能。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值