Hadoop 3.X 和 2.X 的常用端口号和配置文件

Hadoop 常用端口号

  • Hadoop 3.X
    HDFS NameNode 内部通信端口:8020/9000/9820
    HDFS NameNode HTTP UI:9870
    HDFS DataNode HTTP UI:9864
    Yarn 查看任务执行端口:8088
    历史服务器通信端口:19888
  • Hadoop 2.X
    HDFS NameNode 内部通信端口:8020/9000
    HDFS NameNode HTTP UI:50070
    HDFS DataNode HTTP UI:50075
    Yarn 查看任务执行端口:8088
    历史服务器通信端口:19888
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

Hadoop 常用配置文件

  • Hadoop 3.X
    core-site.xml
    hdfs-site.xml
    yarn-site.xml
    mapred-site.xml
    workers
  • Hadoop 2.X
    core-site.xml
    hdfs-site.xml
    yarn-site.xml
    mapred-site.xml
    slaves
### Hadoop 网络配置教程最佳实践 #### 一、理解网络配置的重要性 对于Hadoop集群而言,良好的网络配置至关重要。这不仅影响到节点间的通信效率,还关系着整个集群的数据传输性能以及稳定性[^2]。 #### 二、具体配置方法 ##### 1. 配置主机名解析 为了简化各节点之间的相互识别,在`/etc/hosts`文件中添加所有参与计算的机器IP地址及其对应的主机名称映射关系。这样可以避免DNS查询带来的延迟,并提高连接建立的速度。 ```bash # /etc/hosts 文件示例 192.168.x.xx master 192.168.x.yy slave1 ... ``` ##### 2. 设置无密码SSH登录 确保NameNode其他重要服务所在的服务器可以通过SSH免密钥方式访问DataNodes及其他组件所在的服务端口。这对于自动化部署脚本执行非常有用,同时也减少了人工干预的可能性。 - 在Master节点上生成公私钥对(如果尚未存在) ```bash ssh-keygen -t rsa ``` - 将生成的公钥分发给各个Slave节点 ```bash cat ~/.ssh/id_rsa.pub | ssh user@slave 'cat >> ~/.ssh/authorized_keys' ``` ##### 3. 调整JVM参数以适应高并发场景下的内存分配需求 适当调整Java虚拟机启动时的相关参数,比如-Xmx,-Xms等选项来控制最大堆大小最小初始堆大小,从而更好地支持多线程环境下频繁创建销毁对象的需求. ##### 4. 修改防火墙规则允许必要的TCP端口通讯 确认开放如下常用端口号以便于不同角色之间正常交互: | Role | Port Range | |--------------------|------------------| | NameNode Web UI | 50070 | | DataNode | 50010(DN),50020 | | SecondaryNameNode | 50090 | | ResourceManager | 8088 | | NodeManager | 8042 | > 注意: 实际环境中可能还需要额外放开其他自定义的应用程序所使用的特定端口范围. ##### 5. 合理规划物理拓扑结构与交换设备选型 考虑到大规模分布式存储系统内部存在着大量的随机读写请求,因此建议采用低延迟能力强且具备良好扩展性的万兆甚至更高速率级别的网卡配合相应的核心层接入层三层架构设计思路构建底层基础设施平台;与此同时还要注意挑选质量可靠的品牌产品作为组网部件以防止单点故障的发生概率增加而造成不必要的损失。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值