clickhouse系列之三: clickhouse常用的数据类型

  1. 整形
    固定长度的整型,包括有符号整型或无符号整型。
    整型范围(-2n-1~2n-1-1):
    Int8 - [-128 : 127]
    Int16 - [-32768 : 32767]
    Int32 - [-2147483648 : 2147483647]
    Int64 - [-9223372036854775808 : 9223372036854775807]
    无符号整型范围(0~2n-1):
    UInt8 - [0 : 255]
    UInt16 - [0 : 65535]
    UInt32 - [0 : 4294967295]
    UInt64 - [0 : 18446744073709551615]

  2. 浮点型
    Float32 - float
    Float64 – double
    建议尽可能以整数形式存储数据。例如,将固定精度的数字转换为整数值,如时间用毫秒为单位表示,因为浮点型进行计算时可能引起四舍五入的误差。
    与标准SQL相比,ClickHouse 支持以下类别的浮点数:
    Inf-正无穷:

    :) select 1/0
    ┌─divide(1, 0)─┐
    │          inf │
    └──────────────┘
    

    -Inf-负无穷:

    :) select -1/0
    ┌─divide(1, 0)─┐
    │          -inf │
    └──────────────┘
    

    NaN-非数字:

    :) select 0/0
    ┌─divide(0, 0)─┐
    │          nan │
    └──────────────┘
    
  3. 布尔型
    没有单独的类型来存储布尔值。可以使用 UInt8 类型,取值限制为 0 或 1。

  4. 字符串

    1. String
      字符串可以任意长度的。它可以包含任意的字节集,包含空字节。
    2. FixedString(N)
      固定长度 N 的字符串,N 必须是严格的正自然数。当服务端读取长度小于 N 的字符串时候,通过在字符串末尾添加空字节来达到 N 字节长度。 当服务端读取长度大于 N 的字符串时候,将返回错误消息。
      与String相比,极少会使用FixedString,因为使用起来不是很方便。
  5. 枚举类型
    包括 Enum8 和 Enum16 类型。Enum 保存 ‘string’= integer 的对应关系。
    Enum8 用 ‘String’= Int8 对描述。
    Enum16 用 ‘String’= Int16 对描述。

    用法演示:
    创建一个带有一个枚举 Enum8('hello' = 1, 'world' = 2) 类型的列:
    CREATE TABLE t_enum
    (
        x Enum8('hello' = 1, 'world' = 2)
    )
    ENGINE = TinyLog
    这个 x 列只能存储类型定义中列出的值:'hello'或'world'。如果尝试保存任何其他值,ClickHouse 抛出异常。
    :) INSERT INTO t_enum VALUES ('hello'), ('world'), ('hello')
    
    INSERT INTO t_enum VALUES
    
    Ok.
    
    3 rows in set. Elapsed: 0.002 sec.
    
    :) insert into t_enum values('a')
    
    INSERT INTO t_enum VALUES
    
    Exception on client:
    Code: 49. DB::Exception: Unknown element 'a' for type Enum8('hello' = 1, 'world' = 2)
    从表中查询数据时,ClickHouse 从 Enum 中输出字符串值。
    SELECT * FROM t_enum
    
    ┌─x─────┐
    │ hello │
    │ world │
    │ hello │
    └───────┘
    如果需要看到对应行的数值,则必须将 Enum 值转换为整数类型。
    SELECT CAST(x, 'Int8') FROM t_enum
    
    ┌─CAST(x, 'Int8')─┐
    │               1 │
    │               2 │
    │               1 │
    └─────────────────┘
    
  6. 数组
    Array(T):由 T 类型元素组成的数组。
    T 可以是任意类型,包含数组类型。 但不推荐使用多维数组,ClickHouse 对多维数组的支持有限。例如,不能在 MergeTree 表中存储多维数组。

    可以使用array函数来创建数组:
    array(T)
    也可以使用方括号:
    []
    创建数组案例:
    :) SELECT array(1, 2) AS x, toTypeName(x)
    SELECT
        [1, 2] AS x,
        toTypeName(x)
    
    ┌─x─────┬─toTypeName(array(1, 2))─┐
    │ [1,2] │ Array(UInt8)            │
    └───────┴─────────────────────────┘
    1 rows in set. Elapsed: 0.002 sec.
    
    :) SELECT [1, 2] AS x, toTypeName(x)
    SELECT
        [1, 2] AS x,
        toTypeName(x)
    
    ┌─x─────┬─toTypeName([1, 2])─┐
    │ [1,2] │ Array(UInt8)       │
    └───────┴────────────────────┘
    
    1 rows in set. Elapsed: 0.002 sec.
    
  7. 元组
    Tuple(T1, T2, …):元组,其中每个元素都有单独的类型。

    创建元组的示例:
    :) SELECT tuple(1,'a') AS x, toTypeName(x)
    
    SELECT
        (1, 'a') AS x,
        toTypeName(x)
    
    ┌─x───────┬─toTypeName(tuple(1, 'a'))─┐
    │ (1,'a') │ Tuple(UInt8, String)      │
    └─────────┴───────────────────────────┘
    
    1 rows in set. Elapsed: 0.021 sec.
    
  8. Date
    日期类型,用两个字节存储,表示从 1970-01-01 (无符号) 到当前的日期值。

  9. 可为空(Null)
    允许用特殊标记 (NULL) 表示«缺失值»,可以与 TypeName 的正常值存放一起。例如,Nullable(Int8) 类型的列可以存储 Int8 类型值,而没有值的行将存储 NULL。
    对于 TypeName,不能使用复合数据类型 阵列 和 元组。复合数据类型可以包含 Nullable 类型值,例如Array(Nullable(Int8))。
    Nullable 类型字段不能包含在表索引中。
    除非在 ClickHouse 服务器配置中另有说明,否则 NULL 是任何 Nullable 类型的默认值。
    要在表的列中存储 Nullable 类型值,ClickHouse 除了使用带有值的普通文件外,还使用带有 NULL 掩码的单独文件。 掩码文件中的条目允许 ClickHouse 区分每个表行的 NULL 和相应数据类型的默认值。 由于附加了新文件,Nullable 列与类似的普通文件相比消耗额外的存储空间。

    用法用例
    CREATE TABLE t_null(x Int8, y Nullable(Int8)) ENGINE TinyLog
    INSERT INTO t_null VALUES (1, NULL), (2, 3)
    SELECT x + y FROM t_null
    ┌─plus(x, y)─┐
    │       ᴺᵁᴸᴸ │
    │          5 │
    └────────────┘
    
  10. UUID
    通用唯一标识符(UUID)是用于标识记录的16字节数。
    要生成UUID值,ClickHouse提供了 generateuidv4 功能。
    限制
    UUID数据类型仅支持以下功能 字符串 数据类型也支持(例如, min, max,和 计数).
    算术运算不支持UUID数据类型(例如, abs)或聚合函数,例如 sum 和 avg.

    用法示例 
    示例1
    此示例演示如何创建具有UUID类型列的表并将值插入到表中。
    CREATE TABLE t_uuid (x UUID, y String) ENGINE=TinyLog
    INSERT INTO t_uuid SELECT generateUUIDv4(), 'Example 1'
    SELECT * FROM t_uuid
    ┌────────────────────────────────────x─┬─y─────────┐
    │ 417ddc5d-e556-4d27-95dd-a34d84e46a50 │ Example 1 │
    └──────────────────────────────────────┴───────────┘
    
    示例2
    在此示例中,插入新记录时未指定UUID列值。
    INSERT INTO t_uuid (y) VALUES ('Example 2')
    SELECT * FROM t_uuid
    ┌────────────────────────────────────x─┬─y─────────┐
    │ 417ddc5d-e556-4d27-95dd-a34d84e46a50 │ Example 1 │
    │ 00000000-0000-0000-0000-000000000000 │ Example 2 │
    └──────────────────────────────────────┴───────────┘
    

还有很多数据结构,可以参考官方文档: clickhouse官方文档

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值