刚接触clickhouse,对于olap与oltp有点蒙圈。记录一下当前的认知,比较浅显,有志之士多补充修正。
OLAP与OLTP
OLTP:联机事务处理。主要用于数据库,对业务数据进行数据采集,crud,如mysql这些库。
如对user表,查询id=1的学生信息。
OLAP:联机分析处理。主要用于数据仓库,以大量历史数据为基础,主要进行分析查询。
如查询user表中所有学生的平均年龄。
为什么列式数据库比行式数据库查询快?
其实这里的查询速度快只是基于olap操作而言的。
如一张普通的user表,在行式数据库中是这样的:
在数据存储中,数据是按页划分的,则行式数据库的存储结构:
在列式数据库中:
存储结构:
这时,如果我们执行上面的oltp操作,查询ID=1的学生,在行式数据库存储中则只需要扫描page1就可以获取到数据进行IO。而在列式数据库中,需要分别扫描page1,page2,page3。
来看执行olap操作,行式数据库需要读取全部的数据,然后再读取计算age。而列式数据库只需要对page3中的内容进行计算就可。
行存储和列存储的结构图:
综上所述:
列存储的数据库更适合OLAP
行存储的数据库更适合OLTP