在 5.2.3 GroupBy(分组聚合)节点中,指北君提到了 Type-Based Aggregation 标签页和 Pattern Based Aggregation 标签页,这两个标签页可以用来对某一类型的列或某一种名称模式的列进行计算。下面我们来看一下例子。
Pattern Based Aggregation 标签页
比如有这样的数据:
分组 | 名称 | 财务数据1 | 财务数据2 | 金额数据 |
---|---|---|---|---|
a | havef | 1 | 1.5 | 10.0 |
a | ha | 3 | 2.0 | 11.0 |
a | no_body | 1 | 2.5 | 12.0 |
我们需要对 财务数据1
、财务数据2
、金额数据
进行不同的聚合函数操作,比如求平均值、求和等,以得到以下结果:
分组 | Mean(财务数据1) | Mean(财务数据2) | Sum(金额数据) |
---|---|---|---|
a | 1.6666666666666667 | 2.0 | 33.0 |
可以通过 GroupBy
节点的聚合函数页面进行如下设置:
如果我们对某些特定名称的列在聚合时都使用相同的操作,可以使用 Pattern Based Aggregation 标签页来选择这些列。例如,可以使用正则表达式来匹配列名,将其配置如下图所示。这样做在列名比较规范的情况下,可以节省一些操作。即使将来表格中出现了一些新的 财务数据xxx
列,也不需要再调整此节点。
Type-Based Aggregation 标签页从数据类型的角度进行统一操作。例如,您可以在此标签页中配置对所有整数类型列的求和操作。
同样,这两个标签页的功能对于 pivoting 节点也是适用的。
本文由 mdnice 多平台发布