金仓数据库KingbaseES Numeric介绍(2)
关键字:
KingbaseES、SQL、数据类型、Numeric、人大金仓
KES中的Numeric结构解析(LONG/NAN)
与之前提到的short类的Numeric的实现类似的,long将digit与scale、weight进行存储进行数字的解释。
对于long类的Numeric,n_sign_dscale对应的是header部分,其为sign+scale的总和,scale为有效数字在在小数点后的位数偏移。n_sign_dscale的前两位用于标识该Numeric的符号(sign)后面的14位用于表示scale。
对于long,额外有16位用于存储weight。因此,long类的Numeric可以存储更大范围的数字。
NAN是numeric中的一种特殊情况,表示not a number,他通过choice的前两个bit进行标识,当choice & 0XC000 == 0XC000 时,表示其为NAN类型
KES中列存压缩与Numeric
列存储为Numeric批量插入时进行压缩提供了可能,当大量插入Numeric时,可以通过编码的方式尝试对Numeric进行压缩,以此节省存储空间。
为了实现压缩与解压缩,KES引入了(或即将引入)两种新的Numeric类型 即BI64与BI128,他们表示数字的原理与之前提到的short或long不同。
Bi类型的Numeric中,n_header的解释方式与short、long类似,前四位用于标识该Numeric类型(我们引入了更多类型的Numeric,因此flag位变多了),后续的位数用于标识有效数字的偏移,主要差别在NumericBi64/128使用一个int64/int128对有效数字进行存储(显然,这会降低可以表示的数的范围),因此降低了存储的空间开销。