工业物联网sparkstreaming+kafka+mqtt

最新推荐文章于 2024-05-29 15:13:42 发布

老余不爱吃鱼

最新推荐文章于 2024-05-29 15:13:42 发布

阅读量1.4k

点赞数 1

分类专栏：大数据

本文链接：https://blog.csdn.net/weixin_43053022/article/details/100081808

版权

本文介绍了工业物联网中，数据通过MQTT协议传输至EMQTT，然后Kafka订阅并处理这些数据。SparkStreaming用于消费Kafka数据，并与Oracle数据库中的信息表进行关联计算。此外，还提供了相关的Maven依赖信息。

摘要由CSDN通过智能技术生成

一、概述

工业物联网数据通过mqtt协议发送到emqtt，kafka订阅emqtt数据，sparkstreaming消费kafka数据和原始留存在oracle的信息表关联计算。

二、demo示例

package streamTest

import java.util.concurrent.Future
import java.util.{Date, Properties}

import com.google.gson.Gson
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.clients.producer.{KafkaProducer, ProducerRecord, RecordMetadata}
import org.apache.kafka.common.serialization.{StringDeserializer, StringSerializer}
import org.apache.spark._
import org.apache.spark.broadcast.Broadcast
import org.apache.spark.sql.types._
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.{Durations, Seconds, StreamingContext}
import org.apache.spark.streaming.kafka010._

object KafkaStreamTest {
  def main(args: Array[String]): Unit = {
    val property = new Properties()
    val url = "jdbc:oracle:thin:@//xxx:1634/GPS"
    property.put("user","GPS2")
    property.put("password","123456")
    val conf = new SparkConf().setAppName("kafkaStreamTest").set("spark.driver.allowMultipleContexts","true")
    val ssc = new StreamingContext(conf, Durations.seconds(1))
    val sparkSession = SparkSession.builder().appName("kafkaStreamTest").enableHiveSupport().getOrCreate()
    val rfrunDF=sparkSession.read.jdbc(url,"t_rfrun",property)
    val driverDF=sparkSession.read.jdbc(url,"t_driver",property)
    val msgDF=rfrunDF.join(driverDF,rfrunDF("WORKNUM")===driverDF("WORKNUM"),"inner")
      .select(rfrunDF("equipnum"),rfrunDF("worknum"),rfrunDF("worktime"),rfrunDF("unworktime"),driverDF("name"),driverDF("remark2"))
    msgDF.persist()
    val topics = Array("pocGPS01")
    val kafkaParams = Map[String, Object](
      "bootstrap.servers" -> "xxx:9092",
      "key.deserializer" -> classOf[StringDeserializer],
      "value.deserializer" -> classOf[StringDeserializer],
      "group.id" -> "stream",
      "auto.offset.reset" -> "latest",
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )
    val  kafkaStream: InputDStream[ConsumerRecord[String, String]] = KafkaUtils.createDirectStream[String, String](
      ssc,
      LocationStrategies.PreferConsistent,
      ConsumerStrategies.Subscribe[String, String](topics, kafkaParams)
    )

    val recieveStream=kafkaStream
      .filter(_.value().length>0)
      .filter(_.value().nonEmpty)
      .map(x=>handleJson2CaseClass(x.value()))
      .mapPartitions(iter=>{
          iter.map(x=>{
          var distance=getDistance(x.jd1,x.wd1,x.jd2,x.wd2)
          (x.num1,x.num2,distance,x.alertTime)

最低0.47元/天解锁文章

老余不爱吃鱼

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
工业物联网sparkstreaming+kafka+mqtt

一、概述工业物联网数据通过mqtt协议发送到emqtt，kafka订阅emqtt数据，sparkstreaming消费kafka数据和原始留存在oracle的信息表关联计算。二、demo示例package streamTestimport java.util.concurrent.Futureimport java.util.{Date, Properties}import com...
复制链接

扫一扫

专栏目录