java代码开发flink指南
- 必须的依赖
- 创建项目
- 检查项目
- 构建/编译项目
- 下一步
通过几个简单的步骤就可以使用java程序开发flink
必须的依赖
1:maven3.0.4(或者更高版本)
2:java8.x
创建项目
使用下面的命令创建项目
使用maven命令
$ mvn archetype:generate \
-DarchetypeGroupId=org.apache.flink \
-DarchetypeArtifactId=flink-quickstart-java \
-DarchetypeVersion=1.4.1
或者使用quickstart脚本
curl https://flink.apache.org/q/quickstart.sh | bash
其实也可以手工在idea或者eclipse中创建一个普通maven项目即可【只是创建项目中是空的,不包含flink测试代码,后期熟悉了以后可以自己手工创建项目即可,前期不熟悉的话还是参考官网步骤】。
检查项目
在你的工作目录中将会有一个新目录,如果你使用的是 curl 这种方式创建的项目,这个目录的名称就是 quickstart。否则,目录名称就是你指定的maven项目的 artifactId。
$ tree quickstart/
quickstart/
├── pom.xml
└── src
└── main
├── java
│ └── org
│ └── myorg
│ └── quickstart
│ ├── BatchJob.java
│ └── StreamingJob.java
└── resources
└── log4j.properties
这个实例项目是maven项目,它包含两个class,StreamingJob 和 BatchJob是DataStream和DataSet程序的两个基本实现。main方法是程序的入口,既可以进行测试也可以正式执行。
我们推荐你把这个项目导入到你的IDE中进行开发和测试。IntelliJ IDEA 原生支持maven项目。如果你使用eclipse,使用m2e插件导入maven项目。有的eclipse默认内置了这个插件,有的需要你手工安装。
Mac用户注意:在使用flink的时候,默认的JVM heapsize参数设置的太小。你必须手工调大。在eclipse中,选择 Run Configurations -> Arguments 然后在VM Arguments 输入框中输入 -Xmx800m
构建/编译项目
如果你想对你的项目编译打包,进入你的项目根目录,执行 maven clean package 命令。【前提是你需要在你本机安装maven,并且配置M2_HOME环境变量】。然后你将会在项目根目录的target目录下面看到打包好的jar包:target/<artifact-id>-<version>.jar
注意:如果你使用不同的class而不是使用streamingJob作为入口类,我们建议你在pom.xml文件中修改mainClass配置的类型。这样,flink程序在运行的时候就可以不用特意指定入口类了。
下一步
编程应用程序!
如果你正在编写streaming流处理程序并且在想改写什么,可以看一看这个文档Stream Processing Application Tutorial
如果你正在编写batch批处理程序并且在想改写什么,可以看一看这个文档Batch Application Examples
如果想查看API的完整描述信息,可以看一看这两个API DataStream API 和 DataSet API
如果你有任何问题,可以在我们的邮件列表进行提问,我们非常乐意帮助你。
获取更多大数据资料,视频以及技术交流请加群: