聊一聊数据库的行存与列存

最新推荐文章于 2024-07-30 17:43:20 发布

hebiwen95

最新推荐文章于 2024-07-30 17:43:20 发布

阅读量2.1k

点赞数

文章标签：前端 javascript html

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hebiwen95/article/details/126058340

版权

本文探讨了数据库的行存与列存的存储方式、优缺点及适用场景。行存适合频繁更新和少量插入，列存则在大宽表和查询特定列时更有优势。列存具有更高的压缩率，但使用约束较多，如不支持数组和外键。建议根据数据更新频率、查询列数和表的列数来选择存储类型。

摘要由CSDN通过智能技术生成

好多人最开始学习数据库的时候，是关系数据库，数据以表格形式存储，一行表示一条记录。其实这种就是典型的行存储（Row-based store），将表按行存储到磁盘分区上。

而一些数据库还支持列存储（Column-based store），它将表按列存储到磁盘分区上。

存储方式比较

这两者的差异如下图：

从图上可以看出，行存的时候，一行记录的属性值存储在临近的空间，然后接着是下一条记录的属性值。

而列存的时候，单个属性所有的值存储在临近的的空间，即一列的所有数据连续存储的，每个属性有不同的空间。

这里，大家可以自行思考一下这两种那种更适合查询，那种更适合修改？

在数据写入上的对比:

1）行存储的写入是一次完成。写入建立在操作系统的文件系统上，可以保证写入过程的成功或者失败，数据的完整性因此可以确定。

2）列存储由于需要把一行记录拆分成单列保存，写入次数明显比行存储多，再加上磁头需要在盘片上移动和定位花费的时间，实际时间消耗会更大。所以，行存储在写入上占有很大的优势。

3）还有数据修改，这实际也是一次写入过程。所以，数据修改也是以行存储占优。

在数据读取上的对比:

1）行存储通常将一行数据完全取出，如果只需要其中几列数据的情况，就会存在冗余列，出于缩短处理时间的考量，消除冗余列的过程通常是在内存中进行的。

2）列存储每次读取的数据是集合的一段或者全部，不存在冗余性问题，查找内容连续存储，特别适合投影。

3）两种存储的数据分布。由于列存储的每一列数据类型是同质的，不存在二义性问题。比如说某列数据类型为整型 (int)，那么它的数据集合一定是整型数据。这种情况使数据解析变得十分容易。相比之下，行存储则要复杂得多ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。