ClickHouse原理解析与应用实践
解读数据库性能神器ClickHouse
伊生伊士
这个作者很懒,什么都没留下…
展开
-
MergeTree原理解析(五)
1 MergeTree创建与存储 创建CREATE TABLE [IF NOT EXISTS] [db_name.]table_name ( name1 [type] [DEFAULT|MATERIALIZED|ALIAS expr], name2 [type] [DEFAULT|MATERIALIZED|ALIAS expr], 省略...) ENGINE = MergeTree() [PARTITION BY expr] [ORDER BY ...原创 2020-12-16 21:31:55 · 1074 阅读 · 0 评论 -
数据字典(四)
字典数据常驻内存的特性,所以它非常适合保存常量或经常使用的维度表数据,以避免不必要的JOIN查询;字典中的数据通过字典函数访问,也可以使用特殊的字典表引擎,可以将数据字典挂载到一张代理的数据表下,从而实现数据表与字典数据的JOIN查询;1 内置字典 clickhouse内置字典:Yandex.Metrica字典。2 外部扩展字典 实践后补上!!! 2.1 读取字典方法: (1)通过字典函数 (2)使用字典表引擎 2.2 字典...原创 2020-12-10 21:22:00 · 372 阅读 · 0 评论 -
数据定义(三)
1 ClickHouse的数据类型 分为基础类型、复合类型和特殊类型【基础类型】 ClickHouse则直接使用Int8、Int16、Int32和Int64指代4种大小的Int类型 ClickHouse的浮点数支持正无穷、负无穷以及非数字的表达方式 如果要求更高精度的数值运算,则需要使用定点数。ClickHouse提供了Decimal32、Decimal64和Decimal128三种精度的定点数 字符串由String定义,长度不限。因此在使用String的时候无须声...原创 2020-11-21 15:59:26 · 184 阅读 · 0 评论 -
ClickHouse架构概述(二)
1 ClickHouse的核心特性1.1 完备的DBMS功能DDL DML 权限控制数据备份与恢复 分布式管理1.2 列存储及数据压缩 按列存储:可以减少查询扫描数据量 数据压缩的友好性:压缩的本质是按照一定步长对数据进行匹配扫描,当发现重复部分的时候就进行编码转换;同一列的字段具有相同的数据类型和现实语义,重复项的可能性更高,压缩率要更高1.3 向量化引擎 利用CPU的SIMD指令,本质是通过数据并行来提高性能1.4 关系模型及S...原创 2020-11-18 21:29:06 · 495 阅读 · 3 评论 -
ClickHouse的前世今生(一)
1、传 统 BI 系 统的问题传 统 BI 系 统 对 企 业 的 信 息 化 水 平 要 求 较 高受众小,制约BI发展研 发 过 程 滞 后 了 需 求 的 响 应 时 效2、现 代 BI 系 统不 再 需 要 强 制 捆 绑 于 企 业 数 据 仓 库受众多元化快 速 应 答、 简 单 易 用3、OLAP 架 构分类ROLAP关 系 模 型构建,星 型 模 型 或 者 雪 花 模 型MOLAP多 维 数 组 的 形 式 保 存 数 据预 先 聚 ..原创 2020-11-18 21:25:29 · 335 阅读 · 1 评论