spark操作Redis

需求:需要通过spark对redis里面的数据进行实时读写

实现方案:通过建立连接池,在每台机器上单独建立连接,进行操作

1、利用lazy val的方式进行包装

  class RedisSink(makeJedisPool: () => JedisPool) extends Serializable {
    lazy val pool = makeJedisPool()
  }

  object RedisSink {
    def apply(redisHost: String, redisPort: Int, password: String, database: Int): RedisSink = {
      val createJedisPoolFunc = () => {
        val poolConfig = new GenericObjectPoolConfig()
        val pool = new JedisPool(poolConfig, redisHost, redisPort, Protocol.DEFAULT_TIMEOUT, password, database)
        val hook = new Thread {
          override def run = {
            pool.destroy()
          }
        }
        sys.addShutdownHook(hook.run)
        pool
      }
      new RedisSink(createJedisPoolFunc)
    }
  }

2、使用时,我们利用广播变量的形式,将RedisSink广播到每一个executor

    val redisSink: Broadcast[RedisSink] = {
      sc.broadcast(RedisSink(redisHost, redisPort, redisPassword, redisDatabase))
    }

    val rdd = DataUtils.getKafkaDataSource(ssc, topic, bootstrap, groupId)
    rdd.foreachRDD(recordRDD => {
      if (!recordRDD.isEmpty()) {
        recordRDD.foreachPartition(part => {
          val jedisPool = redisSink.value.pool
          val jedis = jedisPool.getResource
          val pipeline = jedis.pipelined()

          part.foreach(x => {
            val message = x.value()
            val kv = message.split(",")
            val key = kv(0)
            val value = kv(1)
//            jedis.set(key, value)
            pipeline.set(key, value)
          })
          pipeline.sync()
          jedis.close()
        })
      }
    })

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不加班程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值