静静网站流量分析项目之集群部署_10

本文详细介绍了静静网站流量分析项目的集群部署过程,包括Tomcat、Nginx、Flume、Zookeeper、Hadoop、Kafka、Hive、Hbase和Spark的配置与启动。通过Nginx实现负载均衡,Flume收集日志数据,Hadoop进行离线分析,Kafka用于实时数据传输,Spark处理实时流数据,并最终存储于MySQL和Hbase中。
摘要由CSDN通过智能技术生成

浏览器访问应用服务器,得到的页面触发JS,JS采集的数据通过网页嵌入的图片提交到日志服务器 ,日志服务器通过Log4jAppender发给FlumAgent进行数据收集,FlumAgent将数据通过随机分发在两个中心服务器上。

离线分析:
中心服务器将数据按日期存储在HDFS上,用hive对HDFS上的数据进行清洗,得到自己想要的字段保存起来,把清洗后的数据进行处理,通过定时任务hive每天晚上12点自己加载数据进行处理,每天早上只需要检查hive有没有需要的数据,在用户需要的时候可以自己导出到mysql中。最后进行可视化展示。

实时分析:
用“Kafka Sink”将flum中心服务器的数据发布一份到kafka(kafka的生产端是flum,消费端是sparkstreaming),sparkstreaming消费kafka数据,将消费到的数据“kafkaStream”在spark清洗数据,得到清洗后的数据“clearStream”,处理数据(基于清洗后的数据算出8个指标)得到结果数据resultStream。最后将结果数据存储在mysql中。最后进行可视化展示。

以上的服务器我都是在自己本机部署的,考虑到资源问题,所以我的应用服务器没有进行部署

大家可以根据自己的情况,进行部署。但大致流程都是一样

在此之前我们需要5个服务器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值