DataBase_数据库的行式存储与列式存储

存储差异

行式存储:以行为单位进行存储,存储在连续的物理内存上

列式存储:以列为单位进行存储,存储在连续的物理内存上

读取差异

animal表:

nameagecolor
Tomoneblue
Jerry

two

brown
Spikethreegray
Tomfourwhite

查询语句:

select age from animal where name = 'Tom' and color = 'white'

行式存储的查询步骤:

1.根据索引查询出符合 name = 'Tom' and color = 'white' 的行的物理地址

2.从物理地址中取出该行的所有数据

3.从该行的所有数据中取出age列的数据

优势:

1.对于插入/更新而言高效

2.对于查询整行数据而言高效

上述优势源于:行内数据的物理地址是连续的

劣势:

查询时整行的数据都会被读取

列式存储的查询步骤:

了解查询步骤之前,需要先了解数据压缩(通常通过字典表,此处假定字典表的构建算法为自增)

对数据去重后,可得字典:

数据表可转换为:

nameagecolor
111
222
333
144

数据压缩的作用:通过构建算法,可对数据进行压缩,节省存储空间

查询步骤:

1.对于 where name = 'Tom' and color = 'white':

先查询name字典,得知Tom对应的字典ID为1,将1与name列进行匹配,匹配完成后创建bitmap;创建规则:匹配成功处值为1,否则为0:

1
0
0
1

同理可得white与color列匹配后创建的bitmap:

0
0
0
1

2.将上述bitmap进行与运算可得:

0
0
0
1

3.返回bitmap中值为1的行,本例中要求返回age列的数据,故返回age列的第四行的数据

优势:

1.通过数据压缩可节省存储空间
2.任何列都可成为索引
3.查询时只有相关的列的数据会被读取

劣势:

1.查询时需要对查询到的列的数据进行组装
2.对于插入/更新而言较困难,因为列之间的物理地址不是连续的

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值