flink 单词计数demo

单词计数

实时统计每隔1秒统计最近2秒单词出现的次数

实时统计-scala

代码

/导入scala版本的
import org.apache.flink.streaming.api.scala.{
   DataStream, StreamExecutionEnvironment}
import org.apache.flink.streaming.api.windowing.time.Time

object onLine {
   
  def main(args: Array[String]): Unit = {
   
    val environment: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment
    val socketDS: DataStream[String] = environment.socketTextStream("node01",9999)
    //必须导入隐式转换包

    import org.apache.flink.api.scala._
    val result: DataStream[(String,Int)] = socketDS.flatMap(x=>x.split(" "))
      .map(x=>(x,1))
      .keyBy(0) //按照下标为0的单词进行分组
      .timeWindow(Time.seconds(2),Time.seconds(1)) //每个2s处理1s的数据
      .sum(1)

    result.print()
    environment.execute("FlinkStream")
  }

}

输入
在这里插入图片描述

结果
前面的数字表示线程号
在这里插入图片描述
也可以选择打成jar包到yarn中运行


 flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 -c com.wordcount.onLine original-flink_study-1.0-SNAPSHOT.jar 

实时统计-java

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.streaming.api.datastream.*;
import org.apache.flink.streaming.api.environment
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您好!下面是一个简单的示例,演示如何使用 Apache Flink 将数据写入 ClickHouse 数据库。 首先,您需要确保已经安装了 Apache Flink 和 ClickHouse,并且已经设置好了它们的环境。 接下来,您需要在 Flink 作业中引入 ClickHouse 的依赖。在 pom.xml 文件中添加以下依赖项: ```xml <dependencies> <!-- Flink dependencies --> ... <!-- ClickHouse dependency --> <dependency> <groupId>ru.yandex.clickhouse</groupId> <artifactId>clickhouse-jdbc</artifactId> <version>0.3.1</version> </dependency> </dependencies> ``` 然后,您可以编写一个 Flink 作业,将数据写入 ClickHouse。以下是一个简单的示例: ```java import org.apache.flink.api.common.functions.MapFunction; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.clickhouse.ClickHouseSink; import org.apache.flink.streaming.connectors.clickhouse.ClickHouseSinkFunction; import org.apache.flink.streaming.connectors.clickhouse.ClickHouseSinkRequestBuilder; import org.apache.flink.streaming.connectors.clickhouse.common.ClickHouseTableInfo; import org.apache.flink.streaming.connectors.clickhouse.common.ClickHouseTypeInfo; public class FlinkClickHouseDemo { public static void main(String[] args) throws Exception { StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并行度 env.setParallelism(1); // 创建数据流 DataStream<String> dataStream = env.fromElements("data1", "data2", "data3"); // 将数据流转换为 ClickHouseSinkFunction ClickHouseSinkFunction<String> clickHouseSinkFunction = new ClickHouseSinkFunction<String>() { @Override public ClickHouseSinkRequestBuilder getClickHouseRequestBuilder(String element) { ClickHouseTableInfo tableInfo = new ClickHouseTableInfo("your_table", new String[]{"column1"}, new ClickHouseTypeInfo[]{ClickHouseTypeInfo.StringTypeInfo}); return new ClickHouseSinkRequestBuilder(tableInfo).setData(element); } }; // 创建 ClickHouseSink ClickHouseSink<String> clickHouseSink = new ClickHouseSink<>("jdbc:clickhouse://your_clickhouse_server:8123/default", clickHouseSinkFunction); // 将数据写入 ClickHouse dataStream.addSink(clickHouseSink); // 执行作业 env.execute("Flink ClickHouse Demo"); } } ``` 请确保将 "your_table"、"column1"、"your_clickhouse_server" 替换为实际的表名、列名和 ClickHouse 服务器地址。 这只是一个简单的示例,您可以根据实际需求进行更复杂的数据处理和写入操作。 希望这个示例对您有所帮助!如有任何问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值