Apache Flink是一个开源大数据框架和分布式处理引擎,用于在无边界(有定义流的开始,但没有定义流的结束)和有边界(有定义流的开始,也有定义流的结束)数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。
1.flink依赖jdk和scala(安装省略)
jdk环境变量配置:vim /etc/profile
export JAVA_HOME=/home/hadoop/jdk8
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=:$JAVA_HOME/lib/dt