1 数仓开发语言概述

2 SQL语言介绍


3 结构化数据



4 总结
主流开发语言SQL
列存储优点:
单列数据保存在一起,不同列分开存储,导致存下同样一个表需要更多的Block文件,看起来是更复杂了,但是基于列和列分开存储,这种形式天生就适合分布式的存储,并能完全利用并发写入和并发读取的能力
同一列存放在一起,数据类型相同,则更好的进行压缩
同一列存放在一起,则排序更加方便,基于排序方便,where某一列会更加快
行存储优点:
更容易实现事务性、一致性控制。
关系型数据库基本都是行存储,Mysql、Oracle等,因其更强调一致性和事务性
NoSQL多数为列存储,因为高效、吞吐量高,但事务、一致性较弱(也有做到事务性比较强的,但实现更加复杂,需要更多东西来配合)
行: 一致性、事务更加容易实现
列:吞吐量高、性能强,一致性、事务性较弱
本文介绍了SQL语言和结构化数据,重点讨论了列存储和行存储的优缺点。列存储适合分布式存储,利于压缩和快速查询,常见于NoSQL数据库;而行存储在事务处理和一致性方面表现更好,是传统关系型数据库如MySQL、Oracle的基础。两者在吞吐量、一致性、事务性上各有侧重,选择取决于具体应用场景。
4581

被折叠的 条评论
为什么被折叠?



