Flink 入门案例和部署模式

最新推荐文章于 2023-10-12 13:55:32 发布

大曲·蜗牛

最新推荐文章于 2023-10-12 13:55:32 发布

阅读量177

点赞数

分类专栏： Flink 文章标签： flink

本文链接：https://blog.csdn.net/daqu1314/article/details/117804160

版权

Flink 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

1.Flink相关依赖

<dependencies>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-scala_2.11</artifactId>
            <version>1.10.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.flink</groupId>
            <artifactId>flink-streaming-scala_2.11</artifactId>
            <version>1.10.0</version>
        </dependency>
    </dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>net.alchim31.maven</groupId>
                <artifactId>scala-maven-plugin</artifactId>
                <version>3.4.6</version>
                <executions>
                    <execution>
                        <goals>
                            <goal>compile</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-assembly-plugin</artifactId>
                <version>3.0.0</version>
                <configuration>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>single</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>
</project>

1.2批处理案例

object wordCountBetch {
  def main(args: Array[String]): Unit = {
    //创建执行的环境
     val env:ExecutionEnvironment =ExecutionEnvironment.getExecutionEnvironment
    //设置并行度
     env.setParallelism(1)
     val wordAgg: AggregateDataSet[(String, Int)] = env.readTextFile("D:\\ideaProject\\flink-base\\test.txt").flatMap(_.split(" ")).map((_,1)).groupBy(0).sum(1)
      wordAgg.print()

  }
}

1.3流式处理案例

object wordCountStream {
  def main(args: Array[String]): Unit = {

    //创建执行的环境
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment
    //设置并行度
    env.setParallelism(1)
    val wordDS: DataStream[(String, Int)] = env.socketTextStream("127.0.0.1",9999).flatMap(_.split(" ")).map((_,1)).keyBy(0).sum(1)
    wordDS.print()

    //执行job
    env.execute()

2.Flink 部署模式

逻列下flink的各种模式,在实际的生产中,方便使用

2.1 local 单机模式测试环境使用

2.2 standalone集群模式生产环境使用

2.2.1阐述

Client:提交任务

JobManager:分发任务,接收反馈

TaskManager:接收任务,执行任务,反馈结果

2.2.2执行指令案例

bin/flink run   \
/export/servers/flink-1.6.0/examples/batch/WordCount.jar  \
--input  hdfs://cdh1:8020/test/input/wordcount.txt  \
--output hdfs://cdh1:8020/test/output/result.txt   \

2.3 Flink on yarn

2.3.1 Session-cluster 模式(时间短,规模小的作业)

2.3.1.1阐述

Session-cluster 模式流程: 客户端提交作业,接着会向yarn申请资源,资源是固定的永久不变的,如果资源满了,下个flinkjob任务,就会无法提交任务,只有等到,当前的资源释放,才能执行下个flinkjob.

2.3.1.2 执行指令

./yarn-session.sh -n 2 -s 2 -jm 1024 -tm 1024 -nm test -d

-n :TaskManager的数量

-s 每个TaskManager的slot数量默认的是每个taskManager的slot个数是1,默认一个slot一个core

-jm:Jobmanager内存(MB)

-tm:taskManager 内存(MB)

-d:后台执行

./flink run -c com.atguigu.wc.StreamWordCount  FlinkTutorial-1.0-SNAPSHOT-jar-with-dependencies.jar --host lcoalhost –port 7777

是否运行可以查看 node01:8088

yarn application --kill application_1577588252906_0002

2.3.2 Per-Job-Cluster 模式(时间长,规模大的作业)

2.3.2.1阐述

一个flinkJob 对应一个集群,每个flinkjob提交任务时都会单独的向yarn申请资源.一个作业失败不会影响到其他的任务的继续运行

2.3.2.2执行指令

./flink run –m yarn-cluster -c com.atguigu.wc.StreamWordCount  FlinkTutorial-1.0-SNAPSHOT-jar-with-dependencies.jar --host lcoalhost –port 7777

大曲·蜗牛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flink 入门案例和部署模式

1.Flink相关依赖<dependencies> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-scala_2.11</artifactId> <version>1.10.0</version> </depen
复制链接

扫一扫

专栏目录