方案 1
方案 2
flume-1.9.0-bin
hadoop-2.7.7
hbase-1.4.13
hive-2.3.6-bin
jdk1.8.0_241
spark-2.4.5-bin-hadoop2.7
sqoop-1.4.7
tez-0.9.2-bin
zookeeper-3.5.7-bin
kafka_2.11-2.4.1
方案 3
Hadoop 3.1.3
Flume 1.9.0
Kafka 2.4.1
Hive 3.1.2
Sqoop 1.4.7
MySQL 5.7.16
Azkaban 3.8.4
Java 1.8
Zookeeper 3.5.7
方案4
大数据生态服务 服务版本 描述
HDFS 3.1.1 分布式存储服务
YARN 3.1.1 分布式资源调度服务
ZOOKEEPER 3.4.13 分布式注册中心服务
SPARK 3.0.1 分布式计算引擎
HBASE 2.1.10 分布式非关系型数据库
TEZ 0.10.0 优化 MapReduce 任务的 DAG
HIVE 3.1.2 常用的 HQL 数仓工具
PHOENIX 5.1.1 HBase SQL 化查询分析工具
KAFKA 2.12-2.6.1 超高吞吐的分布式消息队列
KAFKAEAGLE 2.0.0 Kafka 可视化管理服务
SQOOP 1.4.7 数据采集与转储服务
FLINK 1.12.1 分布式计算引擎
HUE 4.8.0 可视化管理服务
ZEPPELIN 0.9.0 可视化管理服务
ELASTICSEARCH 7.8.0 分布式全文检索数据库
KIBANA 7.8.0 为 ElasticSearch 提供 Web 页面分析入口
RANGER 2.1.0 授权服务
DOLPHINSCHEDULER 1.3.6 可视化DAG工作流任务调度系统
ALERTMANAGER 0.21.0 发送监控告警信息
GRAFANA 6.5.1 展示监控数据
INFLUXDB 1.8.0 存储监控数据
NODEEXPORTER 1.0.0 读取节点资源监控指标
PROMETHEUS 2.18.1 拉取监控数据