做Aggregate的方法

A、熟悉CUBE的结构,直接手工抓取Characteristic

 

BPropose From Query:比较单纯,直接选择一个Query它就会自动生成两个Agg.,分别为Min(最小情况,就是你下了过滤条件的InfoObject,Max(显示InfoObject + Free Object + Filter OBject)

 

C、From Statistic你要首先启用对应Cube的Statistic,等数据统计一了一定量的时候 它就会按照统计数据自动生成Agg.,一下子会生成多个,选择Optimum,它会做优化,留下合并的情况,都激活后观察一段时间,把使用率较低的杀掉它,剩下的就是精华了。

 

 

如果“记录”字段的值不大于10,就得考虑做的聚集是否够犀利了
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 Apache Flink 中,DataStream API 中的 aggregate 方法用于对流数据进行聚合操作。该方法的参数说明如下: ``` public <T, A, R> SingleOutputStreamOperator<R> aggregate(AggregateFunction<T, A, R> function, WindowAssigner<? super T, W> windowAssigner, Trigger<? super T, ? super W> trigger, Evictor<? super T, ? super W> evictor, AllowedLateness allowedLateness, OutputTag lateDataOutputTag) ``` 其中各参数的含义如下: - function:AggregateFunction 类型,表示聚合函数,用于定义聚合逻辑。 - windowAssigner:WindowAssigner 类型,表示窗口分配器,用于定义数据元素如何分配到不同的窗口中。 - trigger:Trigger 类型,表示触发器,用于定义窗口如何触发计算。 - evictor:Evictor 类型,表示清除器,用于定义窗口中哪些元素应该被清除。 - allowedLateness:AllowedLateness 类型,表示允许延迟的时间,用于定义窗口计算的最大允许延迟时间。 - lateDataOutputTag:OutputTag 类型,表示迟到的数据标记,用于标记迟到的数据。 其中前四个参数为必选参数,后两个参数为可选参数。 聚合函数 AggregateFunction 是必选参数,该函数用于定义聚合逻辑,需要实现 AggregateFunction 接口,并重写该接口中的四个方法:createAccumulator()、add()、getResult() 和 merge()。 窗口分配器 WindowAssigner、触发器 Trigger 和清除器 Evictor 也是必选参数,用于定义窗口如何分配、触发和清除。Flink 提供了多种窗口分配器、触发器和清除器的实现,也可以根据需求自定义实现。 允许延迟的时间 AllowedLateness 和迟到的数据标记 OutputTag 均为可选参数,用于定义窗口计算的最大允许延迟时间和标记迟到的数据。如果不指定这两个参数,则 Flink 默认不允许延迟,迟到的数据会被丢弃。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值