下载maven
添加mvn到Path变量
下载完成后解压,将 apache-maven-3.3.9\bin 添加到系统Path变量中,如下图所示:
修改mvn的本地仓库路径
编辑 apache-maven-3.3.9/conf/settings.xml 文件,填写自定义路径。
创建工程
在命令行中输入:mvn archetype:generate -DarchetypeGroupId=org.apache.flink -DarchetypeArtifactId=flink-quickstart-java -DarchetypeVersion=1.9.0 -DarchetypeCatalog=local
创建工程。
按下图依次输入:
创建Flink工程成功。
使用IDEA打开,添加BatchWCJavaApp.java文件
package com.imooc.flink.java.course02;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.ExecutionEnvironment;
import org.apache.flink.api.java.operators.DataSource;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.util.Collector;
public class BatchWCJavaApp {
public static void main(String[] args) throws Exception {
String input = "file:///D:/workspace/other/flinkPro/flink-train-java/file/input";
// 获取执行环境
ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();
DataSource<String> text = env.readTextFile(input);
text.flatMap(new FlatMapFunction<String, Tuple2<String,Integer>>() {
@Override
public void flatMap(String value, Collector<Tuple2<String, Integer>> collector) throws Exception {
String[] tokens = value.toLowerCase().split("\t");
for(String token : tokens){
collector.collect(new Tuple2<String, Integer>(token, 1));
}
}
}).groupBy(0).sum(1).print();
}
}
其中input文件中的内容为:
hello world welcome
hello welcome
代码执行结果为:(world,1) (hello,2) (welcome,2)