简单介绍ClickHouse

最新推荐文章于 2024-07-31 19:38:21 发布

Java技术债务

最新推荐文章于 2024-07-31 19:38:21 发布

阅读量553

点赞数 1

分类专栏： ClickHouse Java 文章标签：数据库

本文链接：https://blog.csdn.net/qq_40124555/article/details/121797799

版权

Java 同时被 2 个专栏收录

105 篇文章 5 订阅

订阅专栏

ClickHouse

14 篇文章 4 订阅

订阅专栏

文章目录

1、什么是ClickHouse

ClickHouse是列式存储数据库（DBMS）——擅长分析数据，主要用于在线分析处理查询OLAP。20.6版本后新增工具：explain

新版本优化

建表、基于RBO的优化规则
单表查询，关联查询等的优化

特性

物化视图(20.8版本之后，eg：物化MySQL)

2、ClickHouse的特点

2.1 列式存储

采用行式存储时，数据在磁盘上的数据结构是：

采用列式存储时，数据在磁盘上的数据结构时：

缺点：

查询所有人的年龄时，遍历很多不需要的数据，需要全表扫描

**列式存储的好处**

列的聚合、计数、求和等统计操作优于行式存储
由于列的数据类型都是相同的，针对数据存储更容易进行数据压缩
对cache更有利

2.2 DBMS的功能

>几乎覆盖了标准 SQL 的大部分语法，包括 DDL 和 DML，以及配套的各种函数，用户管理及权限管理，数据的备份与恢复。

2.3 多样化引擎

>ClickHouse 和 MySQL 类似，把表级的存储引擎插件化，根据表的不同需求可以设定不同
的存储引擎。目前包括合并树、日志、接口和其他四大类 20 多种引擎。

2.4 高吞吐写入能力

> ClickHouse 采用类 LSM Tree 的结构，数据写入后定期在后台 Compaction。通过类 LSM tree 的结构，ClickHouse 在数据导入时全部是顺序 append 写，写入后数据段不可更改，在后台 compaction 时也是多个段 merge sort 后顺序写回磁盘。顺序写的特性，充分利用了磁盘的吞 吐能力，即便在 HDD 上也有着优异的写入性能。

>官方公开 benchmark 测试显示能够达到 50MB-200MB/s 的写入吞吐能力，按照每行 100Byte 估算，大约相当于 50W-200W 条/s 的写入速度。
>

2.5 数据分区与线程级并行

> ClickHouse 将数据划分为多个 partition，每个 partition 再进一步划分为多个 index granularity(索引粒度)，然后通过多个 CPU 核心分别处理其中的一部分来实现并行数据处理。 在这种设计下，单条 Query 就能利用整机所有 CPU。极致的并行处理能力，极大的降低了查 询延时。

>所以，ClickHouse 即使对于大量数据的查询也能够化整为零平行处理。但是有一个弊端 就是对于单条查询使用多 cpu，就不利于同时并发多条查询。所以对于高 qps 的查询业务， ClickHouse 并不是强项。

3、性能对比

在这里插入图片描述

我的公众号

本文作者：好名字
原文链接：https://www.cuizb.top/myblog/article/1638953470
版权声明：本博客所有文章除特别声明外，均采用 CC BY 3.0 CN协议进行许可。转载请署名作者且注明文章出处。

Java技术债务

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
简单介绍ClickHouse

文章目录1、什么是ClickHouse2、ClickHouse的特点**2.1 列式存储**2.2 **DBMS** 的功能2.3 多样化引擎2.4 高吞吐写入能力2.5 数据分区与线程级并行3、性能对比1、什么是ClickHouseClickHouse是列式存储数据库（DBMS）——擅长分析数据，主要用于在线分析处理查询OLAP。20.6版本后新增工具：explain新版本优化建表、基于RBO的优化规则单表查询，关联查询等的优化特性物化视图(20.8版本之后，eg：物化MySQL)
复制链接

扫一扫