源表 维表
各种group by 后得到对应的字段.
通过自定义函数计算后得到是否相等
流式计算一定要group by 这样才能reduce时在一个机器上. 确保并发问题. 一个时间窗口内.
不同的窗口内.
流程控制case:
如果相等未变就不需要insert到目标表,如果不相等值变了就需要insert到目标表
方案?
通过where条件来进行流程控制.
源表 维表
各种group by 后得到对应的字段.
通过自定义函数计算后得到是否相等
流式计算一定要group by 这样才能reduce时在一个机器上. 确保并发问题. 一个时间窗口内.
不同的窗口内.
流程控制case:
如果相等未变就不需要insert到目标表,如果不相等值变了就需要insert到目标表
方案?
通过where条件来进行流程控制.