Flink
介绍
基于数据流的,有状态的计算,计算作用在有界或者无界的数据流上
流类型
无界流:有开始,没有结束的数据流,采用的处理方式按照一定顺序处理(时间。。。)
有界流:有开始,有结束的数据流,经常采用处理方式用批处理
spark、flink对比
1、spark、flink 支持流、批处理
2、flink 高吞吐、低延迟
词频统计
需求:词频统计(word count),一个文件,统计文件中每个单词出现的次数,分隔符是\t,统计结果输出到控制台(生产环境上肯定是Sink到达目的地)
开发批处理应用程序
实现方式
flink+Java