1.ClickHouse概述
- ClickHouse是俄罗斯的Yandex于2016年开源的面向OLAP列式数据库管理系统(DBMS)
- ClickHouse采用 C++ 语言开发,以卓越的查询性能著称,在基准测试中超过了目前很多主流的列式数据库
- ClickHouse集群的每台服务器每秒能处理数亿到十亿多行和数十千兆字节的数据
- ClickHouse会充分利用所有可用的硬件,以尽可能快地处理每个查询
- 单个查询(解压缩后,仅使用的列)的峰值处理性能超过每秒2TB
- 允许使用类SQL实时查询生成分析数据报告,具有速度快、线性可扩展、硬件高效、容错、功能丰富、高度可靠、简单易用和支持跨数据中心部署等特性,号称在内存数据库领域是最快的
- ClickHouse提供了丰富的数据类型、数据库引擎和表引擎,它所存储的表类似于关系型数据库中的表,默认情况下使用结构化方式在节点本地存储表的数据,同时支持多种数据压缩方式
- ClickHouse独立于Hadoop生态系统**,不依赖Hadoop的HDFS**,但可以扩展HDFS进行数据查询,ClickHouse还支持查询Kafka和MySQL中的数据
- ClickHouse目前已经在很多大型企业中得到了充分的生产验证,其在存储PB级别的数据规模时仍能很好的提供稳健的实时OLAP服务。
1.1 ClickHouse的特性
-
真正面向列的DB