什么是ClickHouse
ClickHouse 是俄罗斯的Yandex(类似于百度等在我们国家的地位)于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告(优势:快))。
什么是列式存储
以下面的表为例:
Id Name Age
1 张三 18
2 李四 22
3 王五 34
采用行式存储时,数据在磁盘上的组织结构为:(相同颜色代表一行)
好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。
而采用列式存储时,数据在磁盘上的组织结构为:(相同颜色代表一列)
这时想查所有人的年龄只需把年龄那一列拿出来就可以了(比起行式存储,列式只需要把需要的列拿出来即可,而行式的话,会吧数据都读出来,然后再一个个去筛选,浪费了很多性能)