电商用户行为分析项目第3节更换Kafka 作为数据源

最新推荐文章于 2022-04-08 22:45:07 发布

江湖侠客

最新推荐文章于 2022-04-08 22:45:07 发布

阅读量302

点赞数

分类专栏： BigData项目【初学】

本文链接：https://blog.csdn.net/weixin_39868387/article/details/104495900

版权

本文档介绍了如何将电商用户行为分析项目的数据源从其他平台更换为Kafka，详细讲述了具体代码实现步骤，包括启动Kafka、Zookeeper等过程，并通过虚拟机演示了数据流的正确触发和接收。

摘要由CSDN通过智能技术生成

上篇：电商用户行为分析项目第2节实时热门商品统计

1、更换Kafka 作为数据源

实际生产环境中，我们的数据流往往是从Kafka获取到的。如果要让代码更贴近生产实际，我们只需将source更换为Kafka即可：

val properties = new Properties()
properties.setProperty("bootstrap.servers", "localhost:9092")
properties.setProperty("group.id", "consumer-group")
properties.setProperty("key.deserializer",
"org.apache.kafka.common.serialization.StringDeserializer")
properties.setProperty("value.deserializer",
"org.apache.kafka.common.serialization.StringDeserializer")
properties.setProperty("auto.offset.reset", "latest")

val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
env.setParallelism(1)

val stream = env
  .addSource(new FlinkKafkaConsumer[String]("hotitems", new SimpleStringSchema(), properties))

当然，根据实际的需要，我们还可以将Sink指定为Kafka、ES、Redis或其它存储，这里就不一一展开实现了。

2、具体代码实现

import java.sql.Timestamp
import java.util.Properties

import org.apache.flink.api.common.functions.AggregateFunction
import org.apache.flink.api.common.serialization.SimpleStringSchema
import org.apache.flink.api.common.state.{
   ListState, ListStateDescriptor}
import org.apache.flink.api.java.tuple.{
   Tuple, Tuple1}
import org.apache.flink.configuration.Configuration
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.functions.KeyedProcessFunction
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.api.scala.function.WindowFunction
import org.apache.flink.streaming.api.windowing.time.Time
import org.apache.flink

最低0.47元/天解锁文章

江湖侠客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
电商用户行为分析项目第3节更换Kafka 作为数据源

上篇：电商用户行为分析项目第2天实时热门商品统计1、更换Kafka 作为数据源实际生产环境中，我们的数据流往往是从Kafka获取到的。如果要让代码更贴近生产实际，我们只需将source更换为Kafka即可：val properties = new Properties()properties.setProperty("bootstrap.servers", "localhost:9...
复制链接

扫一扫