Spark-ClickHouse-ES实时项目第五天-redis去重

该博客介绍了在一个实时项目中如何使用Spark处理日志数据,通过Redis进行去重操作,将新增日活信息存储到ES,并提供数据接口供可视化工程调用。详细内容包括仓库位置、需求分析、Redis配置及RedisUtil的使用方法,并提供了代码测试。
摘要由CSDN通过智能技术生成

仓库位置

日志生成:https://github.com/SmallScorpion/gmall-mock.git
日志服务器:https://github.com/SmallScorpion/gmall-spark-ch-es-realtime.git

需求

在这里插入图片描述

分析

  1. 做日活,取启动日志“GMALL_SPARK_CK_ES_START”中的数据(事件日志也可以做,但是会麻烦一点)
  2. 消费kafka中的数据。
  3. 利用redis过滤当日已经计入的日活设备
  4. 把每批次新增的当日日活信息保存到ES中(也可以做一层聚合数据量变小之后保存到redis或者MDB中)
  5. 从ES中查询出数据,发布成数据接口,通可视化化工程调用。

redis

# bind 128.0.0.1
# protected-mode no
# daemonize yes

启动:/etc/module/redis/src/redis-server /etc/module/redis/redis.conf
查看:ps -ef | grep redis

redisUtil

package com.warehouse.gmall.realtime.util

import redis.clients.jedis.{
   Jedis, JedisPool, JedisPoolConfig}

/**
 * redisUtil
 */
object RedisUtil {
   

  var jedisPool:JedisPool=null

  def getJedisClient: Jedis = {
   
    if(jedisPool==null){
   
      //      println("开辟一个连接池")
      val config = PropertiesUtil.load("config.properties")
      
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值