WordCount打包部署到Flink Standalone 集群模式的运行过程演示

WordCount打包部署到Flink Standalone 集群模式的运行过程演示

一、实验环境


本次实验主要是向大家演示了在Flink Standalone 模式下运行WordCount程序的过程,其目的想让大家知道flink程序开发完成后,如何将其打包上传到服务器,并能通过查看webui界面查看flink相关的概念等。

  1. 虚拟机VMWareworkStation
  2. 操作系统:Centos7.5
  3. nc服务:netcat

集群环境拓扑结构:
在这里插入图片描述

二、程序及打包


  1. 源代码如下:
    package com.suben.flink.wc
    
    import org.apache.flink.api.java.utils.ParameterTool
    import org.apache.flink.streaming.api.scala._
    
    /**
     *  flink run -c com.suben.flink.wc.WordCountStream -p 2 flink-basic-1.0-SNAPSHOT.jar --host master --port 6666
     */
    object WordCountStream {
      def main(args: Array[String]): Unit = {
        // 1. 初始化环境
        val env = StreamExecutionEnvironment.getExecutionEnvironment
    
        // 2. 读取数据并进行转换
        // 从外部命令中提取参数,作为socket主机名和端口号
        val paramTool: ParameterTool = ParameterTool.fromArgs(args)
        val host: String = paramTool.get("host")
        val port: Int = paramTool.getInt("port")
    
        // 接收一个socket文本流
        val inputDataStream: DataStream[String] = env.socketTextStream(host, port)
        // 进行转化处理统计
        val resultDataStream: DataStream[(String, Int)] = inputDataStream
          .flatMap(_.split(" "))
          .filter(_.nonEmpty)
          .map((_, 1))
          .keyBy(0)
          .sum(1)
    
        // 3. 为结果好看些,设置并发度为1
        resultDataStream.print().setParallelism(1)
    
        // 启动任务执行
        env.execute("stream word count")
    
      }
    }
    
    
  2. IDEA中打包:
    在这里插入图片描述
  3. 生成如下图所示程序包:
    在这里插入图片描述

三、代码上传及运行


  1. 使用ssh工具如mobXstrem或者xshell等上传到虚拟机中,如上传到master主节点中。

  2. 启动flink集群,在master主节点上执行命令:start-cluster,回车即可,如图所示:
    在这里插入图片描述

  3. 验证下flink集群是否成功启动,执行:jps命令即可,如图所示:
    在这里插入图片描述

  4. 启动nc服务,执行: nc -l -p 6666,如图所示:
    在这里插入图片描述

  5. 提交程序包到flinkj集群有两种方式

    1. 命令提交方式,执行如下命令即可
      flink run -c com.suben.flink.wc.WordCountStream -p 2 flink-basic-1.0-SNAPSHOT.jar --host master --port 6666
      
    2. flink的集群webui上提交,如下图所示
      在这里插入图片描述
      在这里插入图片描述
  6. 我这里采取的是在webUI上传提交程,程序提交后,会看到如下图所示:
    在这里插入图片描述

  7. 在nc端发送如下数据:

    I love Guizhou
    I love my home
    I love Flink
    I love Bigdata

    如图所示:
    在这里插入图片描述

  8. 我们看看程序运行结果是在slave01从节点上的,如下所示:
    在这里插入图片描述
    点击上图所示【步骤3】的LOG后会跳转到slave01节点界面,具体如下图所示:
    在这里插入图片描述

四、小结


该实验的演示主要想向大家展示了Flink程序打包上传服务器的过程及其提交程序到Flink集群中的两种方式,并能在集群中非常明确从节点才是真正负责程序执行的节点,并能看到Flink流式计算是一个有状态的分布式实时计算框架,这个有状态的特点也是它和其他流式计算框架,如Spark、Storm等最显著的区别。另外,通过webui上也看到了taskmanager负责执行程序外还负责分配task slots并将其注册到Jobmanager中。在webui上你才会看到Flink运行时的架构图中所示的TaskManager和JobManager等组成部分。好勒,我们的实验到此结束!Enjoy yourself ~~~~

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

若兰幽竹

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值