flink项目开发-scala代码模板开发flink指南

scala代码开发flink指南

 

  • 构建工具
  • sbt【建议参考使用下面的maven,sbt模块暂时不做翻译】
  • maven
  1. 必须的依赖
  2. 创建项目
  3. 检查项目
  4. 构建/编译项目
  • 下一步

构建工具

Flink项目可以使用不同的工具进行管理和编译。

sbt和maven

建议使用maven,因为目前大数据开发,工作中使用maven的比较多。

 

================maven=================

必须的依赖

1:maven3.0.4(或者更高)

2:java8.x

创建项目

使用下面的命令创建项目

使用maven命令

$ mvn archetype:generate                               \
      -DarchetypeGroupId=org.apache.flink              \
      -DarchetypeArtifactId=flink-quickstart-scala      \
      -DarchetypeVersion=1.4.1

或者使用quickstart脚本

curl https://flink.apache.org/q/quickstart-scala.sh | bash

其实也可以手工在idea或者eclipse中创建一个普通maven项目即可【只是创建项目中是空的,不包含flink测试代码,后期熟悉了以后可以自己手工创建项目即可,前期不熟悉的话还是参考官网步骤】

检查项目

在你的工作目录中将会有一个新目录,如果你使用的是 curl 这种方式创建的项目,这个目录的名称就是 quickstart。否则,目录名称就是你指定的maven项目的 artifactId。

$ tree quickstart/
quickstart/
├── pom.xml
└── src
    └── main
        ├── resources
        │   └── log4j.properties
        └── scala
            └── org
                └── myorg
                    └── quickstart
                        ├── BatchJob.scala
                        └── StreamingJob.scala

这个实例项目是maven项目,它包含两个class,StreamingJob 和 BatchJob是DataStream和DataSet程序的两个基本实现。main方法是程序的入口,既可以进行测试也可以正式执行。

我们推荐你把这个项目导入到你的IDE中进行开发和测试。

IntelliJ IDEA 原生支持maven和scala开发。根据我们的经验,IntelliJ 提供了最好的flink开发环境体验。

如果使用eclipse,你需要安装下面插件,你可以根据eclipse提供的更新站点安装。

 

  • Eclipse 4.x
  1. Scala IDE
  2. m2eclipse-scala
  3. Build Helper Maven Plugin
  • Eclipse 3.8
  1. Scala IDE for Scala 2.11 or Scala IDE for Scala 2.10
  2. m2eclipse-scala
  3. Build Helper Maven Plugin

构建/编译项目

 

如果你想对你的项目编译打包,进入你的项目根目录,执行 maven clean package 命令。【前提是你需要在你本机安装maven,并且配置M2_HOME环境变量】。然后你将会在项目根目录的target目录下面看到打包好的jar包:target/<artifact-id>-<version>.jar

注意:如果你使用不同的class而不是使用streamingJob作为入口类,我们建议你在pom.xml文件中修改mainClass配置的类型。这样,flink程序在运行的时候就可以不用特意指定入口类了。

下一步

编程应用程序!

如果你正在编写streaming流处理程序并且在想改写什么,可以看一看这个文档Stream Processing Application Tutorial

如果你正在编写batch批处理程序并且在想改写什么,可以看一看这个文档Batch Application Examples

如果想查看API的完整描述信息,可以看一看这两个API  DataStream API 和 DataSet API

如果你有任何问题,可以在我们的邮件列表进行提问,我们非常乐意帮助你。

 

 

 

获取更多大数据资料,视频以及技术交流请加群:

 

 

 

### 回答1: flink-1.14.3-bin-scala_2.12 是Apache Flink的一个版本,它是一个基于分布式数据流处理的开源平台。Flink提供了高效的流处理和批处理能力,支持各种数据源和格式,具有高可用性、可伸缩性、易于使用和开发的特点。 其中,1.14.3代表这个版本是Apache Flink的第1.14.3个稳定版本,其中包含了性能优化、改进和新功能。Scala_2.12表示在这个版本中使用了Scala编程语言的2.12版本,这意味着这个版本支持Scala编程。 在flink-1.14.3-bin-scala_2.12中,最重要的新功能之一是针对Apache Kafka的完整支持。此外,还支持更优秀的可伸缩性,提供了更多的API变更和改进等。它还提供了一些改进,例如在任务重启时恢复状态,提高了批处理的性能和吞吐量。 总之,flink-1.14.3-bin-scala_2.12是一个高效、可伸缩、易于使用和开发的分布式数据流处理平台,支持流处理和批处理,被广泛用于企业级数据处理和实时数据分析。 ### 回答2: Flink-1.14.3-bin-scala_2.12是一个 Apache Flink 的软件发行版,主要针对 Scala 2.12 版本进行构建。Apache Flink是一个分布式流处理引擎,支持批量和流式数据处理和分析,并提供高可用性、可扩展性和容错性等特性。Flink-1.14.3-bin-scala_2.12是Apache Flink最新的稳定版本,其中包含了许多新的特性、改进和修复了一些前版本中存在的问题。在Flink-1.14.3-bin-scala_2.12中,采用了新的caching机制来提高性能,支持Kinesis Video Streams、Kudu、Flink SQL等新的特性,同时也优化了Flink Web Dashboard和Flink SQL Client的用户体验。Flink-1.14.3-bin-scala_2.12的使用需要一定的编程经验,可以使用Java、Scala或Python进行开发。此版本对于需要处理大规模数据的企业或个人提供了有力的支持,可以提高数据处理效率和准确性,同时也降低了使用成本和复杂度。 ### 回答3: Flink是一个大数据处理框架,其最新版本是flink-1.14.3。该版本支持Scala 2.12编程语言,并附带可执行二进制文件,文件名为“flink-1.14.3-bin-scala_2.12”。 该文件中包含了Flink代码和相关依赖库,用户可以直接下载该文件并解压缩后即可开始使用Flink框架进行大数据处理。用户只需要将自己的程序代码打包成JAR文件,并提交给Flink集群运行,Flink就会自动管理和调度任务,实现高效的分布式计算。 该版本中包含了许多新的功能和改进,例如增强的流式数据处理能力、更简洁的API、更快的数据处理速度等。此外,该版本还修复了许多已知的问题和Bug,提高了Flink的稳定性和性能表现。 总之,flink-1.14.3-bin-scala_2.12是Flink框架的最新版本,其包含了许多有用的功能和改进,用户可以下载并使用该版本来进行高效的大数据处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值