CLICKHOUSE学习笔记
2016年Yandex的开源列式数据库,用于在线分析处理(OLAP),能够用SQL查询实时生成分析报告。
一、常用数据类型
1、整型
Int8,Int16,Int32,Int64
2、浮点型
float32 —float(相当于mysql)
float62 —double(相当于mysql)
Inf—正无穷
-Inf—负无穷
NaN—非数字
3、布尔型
没有单独的类型来存储布尔值,可以使用UInt8类型 ,限制取值为0或1
4、字符串
String–包含空字符串,可以任意长度
FixedString(N)—固定长度N的字符串,N为严格的正自然数
5、枚举类型
Enum8
Enum16
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Pq5EimKf-1631236323411)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909163217707.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZX2ywhAM-1631236323415)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909163250431.png)]
6、数组
Array(T)—由T类型元素组成的数组
T可以是任意类型,包含数组类型,但不推荐使用多维数组
创建方式:array(T) \ []
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-30OULPBt-1631236323417)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909163739373.png)]
7、元组
Tuple(T1,T2)—元组,每个元素都有单独的类型
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KNTSIMgk-1631236323419)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909163907326.png)]
8、Date
日期类型,用两个字节存储,表示从1970-01-01(无符号)到当前的日期值
二、表引擎
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WB8AyyE0-1631236323420)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909164147084.png)]
1、TinyLog
最简单的表引擎,数据存储在磁盘上,每列单独压缩存储,写入时将数据附加到文件末尾,不支持索引。
没有并发控制,不能同时读写,如果同时写入多个查询种的表,数据会被破坏。
适用于许多小表的情景。
create table t (a UInt16, b String) ENGINE=TinyLog;
insert into t (a,b) values (1,'abc');
2、Memory
内存引擎,数据以未压缩的原始形式直接保存在内存种,服务器重启数据就会消失。读写操作不会互相阻塞,不支持索引。简单查询下性能高。
3、Merge
本身不存储数据,但可用于同时从任意多个其它的表种读取数据。读是自动并行,不支持写入。读取时,被真正读取到数据的表的索引会被使用。
Merge引擎的参数:一个数据库名+一个用于匹配表名的正则表达式
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aq89rE4b-1631236323422)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909173653363.png)]
**4、MergeTree(合并树)
CK中最牛逼的引擎式MergeTree以及该系列的其它引擎。
有巨量数据要插入到表中,要高效地一批批写入数据片段,并希望这些数据片段在后台按照一定规则合并,相比在插入时不断修改(重写)数据进存储,这种策略会高效很多。
特点:
数据按主键排序
可以使用分区(如果指定了主键)(分区字段必须是Date格式的)
支持数据副本
支持数据采样
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RPsOSA3C-1631236323422)(C:\Users\Alger\Desktop\数仓学习\CLICKHOUSE学习笔记.assets\image-20210909175739222.png)]
[IO的方式:直接IO,缓存IO]
create table mt_table(date Date ,id UInt8, name