ClickHouse介绍
什么是ClickHouse
ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库,其处理数据的速度比传统方法快100-1000 倍。
ClickHouse的性能超过了目前市场上可比的面向列的 DBMS,每秒钟每台服务器每秒处理数亿至十亿多行和数十千兆字节的数据。
ClickHouse基本介绍
ClickHouse作为新兴事物,特点有很多,很多大厂也在使用;关于其特点也不多说了,确切的说是为OLAP量身打造的数据库
ClickHouse使用场景
OLAP的特点
读多于写:不同于事务处理(OLTP)的场景,数据分析(OLAP)场景通常是将数据批量导入后,进行任意维度的灵活探索、BI工具洞察、报表制作等。
大宽表:读大量行但是少量列,结果集较小,在OLAP场景中,通常存在一张或是几张多列的大宽表,列数高达数百甚至数千列。对数据分析处理时,选择其中的少数几列作为维度列、其他少数几列作为指标列,然后对全表或某一个较大范围内的数据做聚合计算。这个过程会扫描大量的行数据,但是只用到了其中的少数列。而聚合计算的结果集相比于动辄数十亿的原始数据,也明显小得多。
数据批量写入:OLTP类业务数据不更新或少更新,对于延时要求更高,要避免让客户等待造成业务损失;而OLAP类业务,由于数据量非常大,通常更加关注写入吞吐量。
无需事务,数据一致性要求低:OLAP类业务对于事务需求较少,通常是导入历史日志数据,或搭配一款事务型数据库并实时从事务型数据库中进行数据同步。
灵活多变,不适合预先建模:分析场景下,随着业务变化要及时调整分析维度、挖掘方法,以尽快发现数据价值、更新业务指标。
ClickHouse使用场景压根就是针对OLAP设计的,并且根据相关的特性做了优化。
ClickHouse核心特征
完备的DBMS功能
ClickHouse拥有完备的管理功能,作为一个DBMS,它具备了一些基本功能,如下所示。
DDL:可以动态地创建、修改或删除数据库、表和视图,而无须重启服务。
DML :可以动态查询、插入、修改或