hadoop2.x 常用端口及定义方法


一. 常用端口号

Hadoop 集群的各部分一般都会使用到多个端口,有些是 daemon 之间进行交互之用,有些是用于 RPC 访问以及 HTTP 访问。而随着 Hadoop 周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如此,以便查询。

这里包含我们使用到的组件:HDFS, YARN, HBase, Hive, ZooKeeper:



1.1 HDFS

组件节点默认端口配置用途说明
HDFSDataNode50010dfs.datanode.addressdatanode 服务端口,用于数据传输
HDFSDataNode50075dfs.datanode.http.addresshttp服务的端口
HDFSDataNode50475dfs.datanode.https.addresshttps服务的端口
HDFSDataNode50020dfs.datanode.ipc.addressipc服务的端口
HDFSNameNode50070dfs.namenode.http-addresshttp服务的端口
HDFSNameNode50470dfs.namenode.https-addresshttps服务的端口
HDFSNameNode8020fs.defaultFS接收 Client 连接的 RPC 端口,用于获取文件系统 metadata 信息
HDFSjournalnode8485dfs.journalnode.rpc-addressRPC服务
HDFSjournalnode8480dfs.journalnode.http-addressHTTP服务
HDFSZKFC8019dfs.ha.zkfc.portZooKeeper FailoverController,用于NN HA

1.2 YARN

组件节点默认端口配置用途说明
YARNResourceManager8032yarn.resourcemanager.addressRM的applications manager(ASM)端口
YARNResourceManager8030yarn.resourcemanager.scheduler.addressscheduler组件的IPC端口
YARNResourceManager8031yarn.resourcemanager.resource-tracker.addressIPC
YARNResourceManager8033yarn.resourcemanager.admin.addressIPC
YARNResourceManager8088yarn.resourcemanager.webapp.addresshttp服务端口
YARNNodeManager8040yarn.nodemanager.localizer.addresslocalizer IPC
YARNNodeManager8042yarn.nodemanager.webapp.addresshttp服务端口
YARNNodeManager8041yarn.nodemanager.addressNM中container manager的端口
YARNJobHistory Server10020mapreduce.jobhistory.addressIPC
YARNJobHistory Server19888mapreduce.jobhistory.webapp.addresshttp服务端口

1.3 HBase

组件节点默认端口配置用途说明
HBaseMaster60000hbase.master.portIPC
HBaseMaster60010hbase.master.info.porthttp服务端口
HBaseRegionServer60020hbase.regionserver.portIPC
HBaseRegionServer60030hbase.regionserver.info.porthttp服务端口
HBaseHQuorumPeer2181hbase.zookeeper.property.clientPortHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口
HBaseHQuorumPeer2888hbase.zookeeper.peerportHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口
HBaseHQuorumPeer3888hbase.zookeeper.leaderportHBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口

1.4 Hive

组件节点默认端口配置用途说明
HiveMetastore9083/etc/default/hive-metastore中export PORT=来更新默认端口 
HiveHiveServer10000/etc/hive/conf/hive-env.sh中export HIVE_SERVER2_THRIFT_PORT=来更新默认端口 

1.5 ZooKeeper

组件节点默认端口配置用途说明
ZooKeeperServer2181/etc/zookeeper/conf/zoo.cfg中clientPort=对客户端提供服务的端口
ZooKeeperServer3888/etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],标蓝部分用于leader选举的。只在electionAlg是1,2或3(默认)时需要


所有端口协议均基于TCP,所以可以使用以下命令去查看

netstat -ntlp
  • 1

这里写图片描述


二. Web UI(HTTP服务)

2.1 对于存在 Web UI(HTTP服务)的所有 hadoop daemon 有如下 url

1. /logs
日志文件列表,用于下载和查看

这里写图片描述


2. /logLevel
允许你设定 log4j 的日志记录级别,类似于 hadoop daemonlog

这里写图片描述


3. /stacks
所有线程的 stack trace,对于 debug 很有帮助

这里写图片描述


4. /jmx
服务端的 Metrics,以 JSON 格式输出。

这里写图片描述

/jmx?qry=Hadoop:* 会返回所有 hadoop 相关指标。

/jmx?get=MXBeanName::AttributeName 查询指定 bean 指定属性的值,例如 /jmx?get=Hadoop:service=NameNode,name=NameNodeInfo::ClusterId 会返回ClusterId。

这个请求的处理类:org.apache.hadoop.jmx.JMXJsonServlet



2.2 特定的 Daemon 又有特定的 URL 路径特定相应信息

NameNode:http://:50070/
  • 1

1. /dfshealth.jsp
HDFS 信息页面,其中有链接可以查看文件系统

/dfsnodelist.jsp?whatNodes=(DEAD|LIVE)

这里写图片描述

显示 DEAD 或 LIVE 状态的 datanode


2. /fsck
运行 fsck 命令,不推荐在集群繁忙时使用!

这里写图片描述


DataNode:http://:50075/
  • 1

3. /blockScannerReport
每个 datanode 都会指定间隔验证块信息

这里写图片描述



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值