1、生产上flinksql经常用到根据指定的userid划分到同一个task任务里进行调度,这时候可以使用group by user_id,解决相同userid分到同一个task处理,但是sink到结果表比如kafka或者sls等mq的消息队列时,如果不指定分区规则,则可能同一个userid也会分到不通partition,这时候就需要指定sink的策略。
2、flink配置日志信息写入到sls日志中。
https://help.aliyun.com/document_detail/173646.html?spm=a2c4g.11186623.6.643.72ac4e65UJ3fIK
3、分区的数据和线程
4、上线之前压测追两个小时数据需要多久时间