从Kafka topic中获取数据并在Spark中进行分析

最新推荐文章于 2021-08-12 09:21:12 发布

kill -9

最新推荐文章于 2021-08-12 09:21:12 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/wowspark/article/details/50317491

版权

从kafka topic中获取数据

依赖的包
spark-assembly-1.4.1-hadoop2.4.0.jar
spark-streaming-kafka-assembly_2.10-1.5.1.jar



import kafka.serializer.StringDecoder
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka.KafkaUtils
import com.pcitc.bigData.demo.storm._


object testprint {

  def main(args: Array[String]): Unit = {

    val Array(zkQuorum, group, topics) = Array("x.x.x.x:2181,x.x.x.x:2181,x.x.x.x:2181,x.x.x.x:2181", "spark-streaming-test", "test")
    /**
     * 创建StreamingContext对象
     */
    val sparkConf = new SparkConf().setAppName("getKafkaData")

    val ssc = new StreamingContext(sparkConf, Seconds(2))
    val topicMap = topics.split(",").map((_, 1)).toMap

    var values = new Array[String](7)

    /**
     * 创建Streaming 从kafka topic中获取数据 并进行处理
     */
    val lines = KafkaUtils.createStream(ssc, zkQuorum, group, topicMap).map(_._2)
    lines.foreachRDD(
      rdd => {
        rdd.foreach(record =>{
          println("=>=>=>=>[INFO: BEGIN TO FORECAST]")

          values = record.toString().split(" ")

          ...

          println("=>=>=>=>[INFO: FORECAST DONE!]")
        })
      })
    ssc.start()
    ssc.awaitTermination()
  }
}

kill -9

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
从Kafka topic中获取数据并在Spark中进行分析

从kafka topic中获取数据依赖的包 spark-assembly-1.4.1-hadoop2.4.0.jar spark-streaming-kafka-assembly_2.10-1.5.1.jarimport kafka.serializer.StringDecoderimport org.apache.spark.SparkConfimport org.apache.spark
复制链接

扫一扫