关键字:
KingbaseES、聚集函数、corr_k、相关性聚集函数、人大金仓、KingbaseES
概述
在目前的KingbaseES的使用过程中,我们会遇到一些需要对数据进行分析的场景,这些场景往往伴随着对数据库表的修改或是分析的过程,用户在使用数据时并不仅仅希望数据库可以提供数据存取的能力,往往还希望数据库存取数据的便利性实现对数据的定性或定量分析,而这些分析函数就是数据库中所提供的聚集函数。
那么如何使用KingbaseES数据库对数据进行分析,或者如何使用KingbaseES数据库提供的聚集函数,从而方便我们对数据进行分析处理,那么本文接下来将从一些聚集函数的定义与使用角度来介绍KingbaseES所拥有的强大的数据分析能力。
相关性聚集函数
聚集函数是KES所提供的用于将数据库中用户所需的数据进行聚集处理的函数,这些函数可以用于分析对应数据的趋势信息,从而对用户输出一些参数用于用户进一步去处理和分析,聚集函数可以将数据库中用户所需的数据进行聚合操作,位运算聚集函数是我们较为常见的聚集函数,接下来在本文中我们将继续介绍KES中所提供的一些自定义函数,主要包括这些函数的使用方法,功能以及函数参数介绍等。并将这些函数以小章节的形式展开介绍,方便读者了解这些函数的具体功能与使用方法。
2.1 corr_k
Corr_k函数是一个计算相关性聚集的函数,它支持输入可以为列名,数据类型可以为数字或空值,在PG中有和KES类似的函数为corr函数,但其只能接受int类型的参数,而KES所提供的该函数不仅可以接受int类型还可以计算浮点类型的数值,它的具体语法如下所示:
Corr_k(number arg, number arg,varchar mode)
从函数声明语法的角度可以看出,这个参数接受类型为number类型,它通过接受两列的入参来计算这两列数据的相关性,第三个参数是一个统计相关的计算值,该值可以指定不同的统计量计算值,通过不同统计量可以规划计算得到不同的相关性显著值,这些值均是一个区间趋势计算值,没有实际的意义仅作为定性分析过程中使用。第三个参数可取的参数有:COEFFICIENT,ONE_SIDED_SIG,ONE_SIDED_SIG_POS,ONE_SIDED_SIG_NEG,TWO_SIDED_SIG。
函数语法如下:
{ CORR_K }
(EXPR1, EXPR2
[, { COEFFICIENT
| ONE_SIDED_SIG
| ONE_SIDED_SIG_POS
| ONE_SIDED_SIG_NEG
| TWO_SIDED_SIG
}
]
)
EXPR1:是第一个数据集,可以是列名、子查询、常量表达式,支持KES中除XML、TEXT、BYTEA外任意基础数据类型。
EXPR2:是第二个数据集,同样可以是列名、子查询、常量表达式,支持KES中除XML、TEXT、BYTEA外任意基础数据类型。
参数三OPT为可选参数:
参数选项 | 含义 | ||
COEFFICIENT | 返回相关系数的值,其取值范围在-1到+1之间,-1表示完全负相关,0表示没有相关性,1表示完全正相关。(默认选项) | ||
ONE_SIDED_SIG | 返回单侧置信度水平的显著性值。该值表示拒绝原假设的概率与所指定的单侧置信度水平相比的大小。 | ||
ONE_SIDED_SIG_POS | 返回正相关的单侧置信度水平的显著性值。即拒绝原假设(相关系数为0)的概率。 | ||
ONE_SIDED_SIG_NEG | 返回负相关的单侧置信度水平的显著性值。即拒绝原假设(相关系数为0)的概率。 | ||
TWO_SIDED_SIG | 返回双侧置信度水平的显著性值。该值表示拒绝原假设的概率与所指定的双侧置信度水平相比的大小。 | ||
函数声明: | CORR_K(EXPR1,EXPR2,OPT); | ||
功能描述 | CORR_K:计算Kendall's tau-b相关系数 | ||
输入参数: | EXPR1:是第一个待计算数据集 EXPR2:是第二个待计算数据集 OPT:是一个字符串,用于指定要计算的相关系数类型。 | ||
返回值: | NUMBER类型 | ||
备注: | 无 |
函数使用技巧
通过第二章节的介绍,我们大致了解了这些聚集函数的基本功能,并且了解了其函数的返回值以及参数类型,那么在了解这些内容的基础上,我们就可以很好的实现这个函数的调用,corr_k函数是KES的一个插件,在使用过程中需要create extension kdb_oracle_aggex来创建该插件,具体的调用方法如下所示:
Create extension kdb_oracle_aggex;
Select corr_k(col_name,col_name,‘COEFFICIENT’) from table;
我们可以通过上述语句来计算两列的Kendall's tau-b相关系数值来分析表中该列的数据关系等。
总结
在KingbaseES数据库的使用过程中,我们总是要应对各种各样的数据分析与数据处理操作,而对于定性和定量的分析,KingbaseES提供了一些数理统计分析函数来提供将数据的数据趋势进行提取等操作,为用户直观的展示数据库中数据的变化趋势以及数据的分布趋势等信息,帮助用户在其他方面的应用于处理中减轻工作难度,在使用过程中,我们任然需要加强对KingbaseES的探索,因为KingbaseES是一个强大的数据库管理系统,这里任然有许多强大的功能与特性值得我们去发现。