集群搭建实例总结


一:搭建集群关键词:

服务器 :内存 硬盘 CPU

显示屏

网线(光纤)

机柜(机架)

外设(如键盘鼠标等)

交换机

预备电源(备用电源以防意外断电)


二 选择服务器考虑因素:

服务器的类型一般机架式,塔式,刀片式三种

一台服务器的内存至少32GB商业常用为64 128 256居多,硬盘最大容量,一般十几到二十几GB大小,CPU个数,2或者4颗居多,接口类型 一般为SAS,产品结构1U或者2U(U即是服务器的厚度单位)


如搭建200T容量的集群所需实际磁盘空间考虑的因素:

首先有三个副本即200T*3=600T

然后磁盘的利用率(实际存放的数据空间量)为85%即是600T/0.85=705T+45T(预算空间)=750T


以集群中配置服务器最大内存为24T为例所需datanode节点数

750T/24T=37个+NN +SNN+RM+RM备用+Zookeeper(Jounal Node)*3=44台

解释如下:

37为Datanode个数

NN即为NameNode

SNN=StandbyNameNode为NN的备用结点.

RM为RourseManager

ZK与JN在同一台节点上,因为一旦NN发生故障ZK会读取JN的信息,以便于将转移的SNN中

为了降低集群的耦合性.以防在集群发生故障时,避免造成无可挽回的损失从而将RM与NN剥离到两个节点上


三 下面两张图为别为集群的报表图,和集群的搭建图



更多服务器实时信息和更为详细参数参见 中关在线http://detail.zol.com.cn/389/388856/param.shtml







  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Airflow集群搭建是指在Airflow平台上部署多台机器来共同运行和管理任务调度。为了提高可靠性、可扩展性和性能,搭建Airflow集群是一个不错的选择。 首先,需要安装和配置Apache Airflow。可以通过pip安装Airflow并进行相关配置,包括数据库连接、身份验证、队列和消息代理等。 接下来,需要设置数据库。Airflow使用数据库来存储任务和运行状态。可以选择使用传统的关系型数据库如MySQL或PostgreSQL,也可以选择使用NoSQL数据库如MongoDB。 然后,需要配置调度器和执行器。Airflow使用调度器来创建和调度任务实例,并使用执行器来执行任务。可以选择使用本地调度器和执行器,也可以选择使用分布式调度器如Celery和分布式执行器如Dask。 在搭建Airflow集群时,还需要设置和配置任务队列和消息代理。可以选择使用RabbitMQ、Redis或Kafka等消息队列,以及使用Celery、SQS或Google Cloud Pub/Sub等消息代理。 另外,为了保证集群的高可用性,可以使用负载均衡器来均衡集群中各个节点的负载。可以选择使用Nginx或HAProxy等负载均衡器。 最后,需要进行集群的监控和管理。可以使用监控工具如Prometheus和Grafana来监控集群中各个节点的运行状态和性能指标,以及使用调度器和执行器的日志来进行任务的管理和故障排查。 总结而言,搭建Airflow集群需要安装和配置Airflow、设置和配置数据库、调度器和执行器、任务队列和消息代理,以及设置负载均衡器和监控工具。这样可以实现任务调度的高可用性、可扩展性和性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值