大数据学习(一)：实时处理环境搭建

最新推荐文章于 2024-07-28 19:47:01 发布

晨丢丢

最新推荐文章于 2024-07-28 19:47:01 发布

阅读量3.1k

点赞数 2

分类专栏：大数据文章标签：大数据 hadoop storm

本文链接：https://blog.csdn.net/zhangchen2449/article/details/52372028

版权

概述

为了实现搭建一套初步学习大数据实时分析的平台，用了5台linux虚拟机(Centos 7)，安装的组件包括：
- FlumeNG：数据采集
- kafka集群：数据统一接入
- Storm集群：数据实时处理
- hadoop集群：这里只是用了其中HDFS组件来做数据存储
整个实时处理框架如下：

本人自己搭建环境的节点分布如下：

服务	节点
Hadoop集群	172.16.100.78(NameNode),172.16.100.79(DataNode),172.16.100.12(DataNode)
Zookeeper集群	172.16.100.12 172.16.100.13, 172.16.100.14
Kafka集群	172.16.100.12, 172.16.100.13, 172.16.100.14
Storm集群	172.16.100.12(nimbus), 172.16.100.13(supervisor), 172.16.100.14(supervisor)
FlumeNG	根据需要装在需要采集日志的应用服务器节点(172.16.100.12)