【Spark实战系列】sparkstreaming 同时消费多个 topic 的数据实现 exactly-once 语义

最新推荐文章于 2023-03-05 21:18:56 发布

JasonLee实时计算

最新推荐文章于 2023-03-05 21:18:56 发布

阅读量9.6k

点赞数 5

分类专栏： Spark 实战系列文章标签： spark sparkstreaming topic 多个topic 同时

本文链接：https://blog.csdn.net/xianpanjia4616/article/details/81709075

版权

Spark 实战系列专栏收录该内容

41 篇文章 289 订阅 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

最近很多人问我,sparkstreaming怎么消费多个topic的数据,自己维护offest,其实这个跟消费一个topic是一样的,但还是有很多问我,今天就简单的写一个demo,供大家参考,直接上代码吧,已经测试过了.我把offest存到redis里了,当然也可以保存在zk,kafka,mysql,hbase中都可以,看自己的选择.(用了3个topic,每个topic5个partition.)

package spark

import java.io.File
import kafka.{PropertiesScalaUtils, RedisKeysListUtils}
import kafka.streamingRedisHive.{dbIndex}
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.log4j.{Level, Logger}
import org.apache.spark.TaskContext
import org.apache.spark.sql.SparkSession
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka010._
import redis.RedisPool

object moreTopic {
  def main(args: Array[String]): Unit = {
    Logger.getLogger("org.apache.spark").setLevel(Level.INFO)
    Logger.get

了解本专栏

超级会员免费看

JasonLee实时计算

关注

5
点赞
踩
24

收藏

觉得还不错? 一键收藏
打赏
22
评论
【Spark实战系列】sparkstreaming 同时消费多个 topic 的数据实现 exactly-once 语义

最近很多人问我,sparkstreaming怎么消费多个topic的数据,自己维护offest,其实这个跟消费一个topic是一样的,但还是有很多问我,今天就简单的写一个demo,供大家参考,直接上代码吧,已经测试过了.我把offest存到redis里了,当然也可以保存在zk,kafka,mysql,hbase中都可以,看自己的选择.(用了3个topic,每个topic5个partition.)...
复制链接

扫一扫