Clickhouse数据库四:数据类型
主要介绍一些与其他数据库不同的数据类型
参考官方文档: https://clickhouse.tech/docs/en/sql-reference/data-types/
4.1 整数类型
- Int Ranges
Int8 - [-128 : 127]
Int16 - [-32768 : 32767]
Int32 - [-2147483648 : 2147483647]
Int64 - [-9223372036854775808 : 9223372036854775807]
- Uint Ranges
UInt8 - [0 : 255]
UInt16 - [0 : 65535]
UInt32 - [0 : 4294967295]
UInt64 - [0 : 18446744073709551615]
注意: 这些类型的是严格区分大小写的
4.2 浮点型
Float32 - float
Float64 - double
尽量使用整形, 因为浮点型计算会有精度问题.
hadoop102 :) select 1-0.9;
SELECT 1 - 0.9
┌───────minus(1, 0.9)─┐
│ 0.09999999999999998 │
- 浮点型中的: NaN和inf
hadoop102 :) select 1/0;
SELECT 1 / 0
┌─divide(1, 0)─┐
│ inf │
└──────────────┘
hadoop102 :) select 0/0;
SELECT 0 / 0
┌─divide(0, 0)─┐
│ nan │
└──────────────┘
4.3 Decimal类型
浮点数精度不够, Decimal可以替代浮点型
Decimal32(s),相当于Decimal(9-s,s)
Decimal64(s),相当于Decimal(18-s,s)
Decimal128(s),相当于Decimal(38-s,s)
说明:
- s 表示小数位数
4.4 Boolean类型
没有单独的类型来存储布尔值。可以使用 UInt8 类型,取值限制为 0 或 1
4.5 字符串
-
String
字符串可以任意长度的。它可以包含任意的字节集,包含空字节。 -
Fixedstring(N)
固定长度 N 的字符串,N 必须是严格的正自然数。当服务端读取长度小于 N 的字符串时候,通过在字符串末尾添加空字节来达到 N 字节长度。 当服务端读取长度大于 N 的字符串时候,将返回错误消息。
与String相比,极少会使用FixedString,因为使用起来不是很方便。
4.6枚举类型
包括 Enum8 和 Enum16 类型。Enum 保存 'string'= integer
的对应关系。
Enum8 用 ‘String’= Int8 对描述。
Enum16 用 ‘String’= Int16 对描述
案例:
- 建表
CREATE TABLE t_enum
(
`x` Enum('hello' = 1, 'world' = 2)
)
ENGINE = TinyLog
- 插入数据
INSERT INTO t_enum VALUES ('hello'), ('world'), ('hello') // ok
INSERT INTO t_enum values('a') // error Unknown element 'a' for type Enum8('hello' = 1, 'world' = 2)
- 使用场景:
对一些状态、类型的字段算是一种空间优化,也算是一种数据约束。但是实际使用中往往因为一些数据内容的变化增加一定的维护成本,甚至是数据丢失问题。所以谨慎使用。
4.7 时间类型
目前clickhouse 有三种时间类型
- Date 接受 年-月-日 的字符串比如 ‘2019-12-16’
- Datetime 接受 年-月-日 时:分:秒 的字符串比如 ‘2019-12-16 20:50:10’
- Datetime64 接受 年-月-日 时:分:秒.亚秒 的字符串比如 ‘2019-12-16 20:50:10.66’
4.8 数组
Array(T):由 T 类型元素组成的数组, T 可以是任意类型,包含数组类型。
但不推荐使用多维数组,ClickHouse 对多维数组的支持有限。例如,不能在 MergeTree 表中存储多维数组。
创建方式:
- 使用Array函数
hadoop102 :) SELECT array(1, 2) AS x, toTypeName(x) ;
SELECT
[1, 2] AS x,
toTypeName(x)
┌─x─────┬─toTypeName(array(1, 2))─┐
│ [1,2] │ Array(UInt8) │
└───────┴─────────────────────────┘
- 使用 [ ] 语法 索引从1开始
hadoop102 :) SELECT array(1, 2000) AS x, x[2] ;
4.9 其他数据类型
参考官网: https://clickhouse.tech/docs/en/sql-reference/data-types/