SparkStreaming(伪实时计算框架)介绍,使用

本文介绍了SparkRDD与SparkStream的区别,并详细讲解了如何使用SparkStream从Kafka获取数据,最终将数据存储到数据库中,涉及实时处理流程。
摘要由CSDN通过智能技术生成

一、SparkRDD和SparkStream的区别

二、SparkStream从Kafka上获取信息最后保存到数据库中

package com.stream.com

import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.{HashPartitioner, SparkConf, SparkContext}
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.spark.streaming.kafka010._
import org.apache.spark.streaming.kafka010.LocationStrategies.PreferConsistent
import org.apache.spark.streaming.kafka010.ConsumerStrategies.Subscribe

/**
 * TODO
 *
 * @author 徐磊
 * @email wc199608203213@136.com
 * @data2020/02/04 上午 11:43
 */
object SparkStream extends App {
//累加函数
  val lj=(it:Iterator[(String,Seq[Int],Option[Int])])=>{
    it.flatMap{
      case(x,y,z)=>Some(y.sum+z.getOrEl
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值