数据源:kafka topic数据类型为json
业务场景:解析json,由于数据层级比较深,而且包含数组,此处键值可能为空
所以数据就变成了双流join,甚至是多流join。
问题原因:采用left join导致数据回撤,然后同一个主键数据产生重复
是采用inner join 还是 outer join,具体区别见 Flink Sql教程(5)_狄杰的博客-CSDN博客_connector.startup-mode
Flink Sql on Zeppelin(5)——双流Join_狄杰的博客-CSDN博客
由于此处关联可能存在键值为空匹配不到的情况