Spark实战项目1-模拟网站流量分析与展示

本文介绍了使用Spark Streaming处理模拟网站访问日志,通过Flume和Kafka进行数据流转,存储数据到Hbase,并用Spring Boot进行数据展示的实战项目。项目包括数据生成、环境启动、Hbase表创建、Kafka topic创建、Flume配置、Spark Streaming项目及Spring Boot项目创建。该项目展示了如何整合这些技术进行实时数据分析。
摘要由CSDN通过智能技术生成

1、概述

这是在学习spark过程中写的一个小Demo。使用python来生成模拟网站访问的日志,通过Spark Streaming对日志经过分析,然后存储进Hbase中,并且使用Spring Boot进行数据的读取与展示。这个Demo是Spark streaming 与flume kafka整合的扩充,只不过增加了将数据存储进HBase和后续的Spring boot展示。该Demo的流程如如下所示:
在这里插入图片描述
可以看出数据自从python产生后经过Flume、kafka等最终流向Spring boot。项目的最终效果图如下所示
在这里插入图片描述
在这里插入图片描述
分别对当天网站里的课程访问量,以及相关课程引流的来源进行分析,也就是从哪些搜索引擎点击进入的。
项目的具体代码都在我的github中,https://github.com/XiaoQQin/Spark-Porjects/Real time analysis of website traffic</

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值