1. 项目概述

1. 项目背景

本项目是一个基于日志的大数据实战项目。主要功能是通过Python 脚本产生模拟登陆日志,使用Flume收集信息,上传到kafaka,通过Spark Streaming 消费kafka的数据,存入HBase中。

后续在HBase的数据上,进行可视化的开发。

项目的整体架构如下图所示:

项目架构

2. 模块简介

  • Flume

    Apache Flume 是一个分布式日志收集系統。本项目中主要使用Flume监控日志文件,并把数据发送至Kafka。

  • Kafka

    kafka是一个按照分布式事务日志架构的大规模发布/订阅消息队列。本项目中的主要作用是作为Flume 和 SparkStreaming的中转站。

  • Spark Streamig

    分布式实时处理框架。本项目中的主要作用是消费Kafka中的日志数据,完成数据格式的转换,并存入HBase中。

  • HBase

    HBase是一个开源的非关系型分布式数据库(NoSQL)。本项目中主要用于存储处理后的数据。

  • Spring Boot

    读取数据,为可视化提供数据接口。

  • Echarts

    完成数据的可视化展示。

3. 环境版本

  • Flume

    apache-flume-1.9.0

  • Kafka

    kafka_2.11-2.1.1

  • Spark

    spark-2.4.0-bin-2.6.0-cdh5.7.0

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值