flink是一款开源的大数据流式处理框架,他可以同时批处理和流处理,具有容错性、高吞吐、低延迟等优势,本文简述flink的编程模型。
数据集类型:
-
无穷数据集:无穷的持续集成的数据集合
-
有界数据集:有限不会改变的数据集合
常见的无穷数据集有:
-
用户与客户端的实时交互数据
-
应用实时产生的日志
-
金融市场的实时交易记录
-
…
数据运算模型有哪些呢?
-
流式:只要数据一直在生产,计算就持续地运行
-
批处理:在预先定义的时间内运行计算,当完成时候释放计算机资源
Flink它可以处理有界的数据集,也可以处理无界的数据集,它可以流式的处理数据,也可以批量的处理数据。