1.简介
streams API是处理分析存储在kafka数据的客户端程序库,其通过state store可以实现高效状态操作,并且支持原语processor和高层抽象dsl。
2.结构图
从结构图中可以看到数据的流向,首先会有消费者消费partition中的数据,经过流处理之后,会经由生产者推给其它topic的partition。
3.核心概念
(1).流拓扑图
结构图Task1-1中,圆圈表示流处理器,箭头表示数据流,数据流之间的关系图叫做流拓扑图。
(2).流和流处理器
流是指数据流,流处理器是指对数据流做的处理。
(3).源处理器和Sink处理器
结构图Task1-1中,第一个圆圈表示源处理器即数据的源头,最后一个圈表示Sink处理器即数据处理的结果。