Aggregate 模型
是相同key的数据进行自动聚合的表模型。表中的列按照是否设置了 AggregationType,分为 Key(维度列)和 Value(指标列),没有设置 AggregationType 的称为 Key,设置了 AggregationType 的称为 Value。当我们导入数据时,对于 Key 列相同的行会聚合成一行,而 Value 列会按照设置的AggregationType 进行聚合。AggregationType 目前有以下四种聚合方式:
-
SUM:求和,多行的 Value 进行累加。
-
REPLACE:替代,下一批数据中的 Value 会替换之前导入过的行中的 Value。
-
REPLACE_IF_NOT_NULL :当遇到 null 值则不更新。
-
MAX:保留最大值。
-
MIN:保留最小值。
有如下场景:需要创建一个表,来记录公司每个用户的每一次消费行为信息,有如下字段
| 用户id | 数据插入日期 | 城市 | 年龄 | 性别 | 访问时间 | 每次消费金额 | 用户的停留时长 |
| 10000 | 2017/10/1 | 北京 | 20 | 0 | 2017/10/01 06:00:00 | 20 | 10 |
| 10000 | 2017/10/1 | 北京 |

Doris的Aggregate模型用于相同key的数据聚合,分为Key和Value列,Key为维度列,Value为设置AggregationType的指标列。AggregationType包括SUM、REPLACE、REPLACE_IF_NOT_NULL和MAX/MIN。在案例中,创建了一个表记录用户消费行为,包括最后一次访问时间、总消费金额和最长最短停留时间。通过聚合模型和SQL示例,展示了如何在数据插入和查看时进行聚合操作。
最低0.47元/天 解锁文章
621

被折叠的 条评论
为什么被折叠?



