大数据常用端口

1.1  HDFS端口

参数

描述

默认

配置文件

例子值

fs.default.name namenode

namenode高可用 RPC交互端口

8020

core-site.xml

hdfs://master:8020/

dfs.http.address 

NameNode web管理端口

50070

hdfs- site.xml

0.0.0.0:50070

dfs.datanode.address

datanode的服务端口,用于数据传输

50010 

hdfs -site.xml 

0.0.0.0:50010

dfs.datanode.ipc.address

datanode的RPC服务器地址和端口

50020

hdfs-site.xml

0.0.0.0:50020

dfs.datanode.http.address

datanode的HTTP服务器和端口

50075

hdfs-site.xml 

0.0.0.0:50075

fs.default.name非高可用的HDFS RPC通讯端口9000hdfs-site.xml0.0.0.0:9000
     

常见端口汇总:

Hadoop:    

    50070:HDFS WEB UI端口

    8020 : 高可用的HDFS RPC端口

    9000 : 非高可用的HDFS RPC端口

    8088 : Yarn 的WEB UI 接口

    8485 : JournalNode 的RPC端口

    8019 : ZKFC端口

   19888:jobhistory WEB UI端口

Zookeeper:

    2181 : 客户端连接zookeeper的端口

    2888 : zookeeper集群内通讯使用,Leader监听此端口

    3888 : zookeeper端口 用于选举leader

Hbase:

    60010:Hbase的master的WEB UI端口 (旧的) 新的是16010

    60030:Hbase的regionServer的WEB UI 管理端口    

Hive:

    9083  :  metastore服务默认监听端口

    10000:Hive 的JDBC端口

Spark:

    7077 : spark 的master与worker进行通讯的端口  standalone集群提交Application的端口

    8080 : master的WEB UI端口  资源调度

    8081 : worker的WEB UI 端口  资源调度

    4040 : Driver的WEB UI 端口  任务调度

    18080:Spark History Server的WEB UI 端口

Kafka:

    9092: Kafka集群节点之间通信的RPC端口

Redis:

    6379: Redis服务端口

CDH:

    7180: Cloudera Manager WebUI端口

    7182: Cloudera Manager Server 与 Agent 通讯端口

HUE:

    8888: Hue WebUI 端口
 

 

 

1.2  HDFS的细节参数说明

①整个集群中所有的NamdeNode、DataNode、JournalNode而言,每个节点中的ClusterID相同
clusterID=CID-93fd95ec-4744-4970-ad8b-42a1bb2ab2a1

②整个集群中所有的NameNode、JournalNode、DataNode节点上,所有的NameSpaceID相同

 namespaceID=1563477261

③整个集群中所有的DataNode,每个DataNode上blockpoolID相同,StorageID、DatanodeUuid不同

storageID=DS-55f77a76-67ec-4161-8bfa-4cbb3c7c83be
datanodeUuid=f9456c36-79b5-4333-9f04-835e1b08efeb

blockpoolID=BP-1080241145-10.70.24.84-1544533356457

④ layoutVersion

layoutVersion定义了HDFS持久化数据结构的版本号,它的值是负值。当HDFS的持久化数据结构发生了变化,如增加了一些其他的操作或者字段信息,则版本号会在原来的基础上减1。Hadoop 1.2.1版本中,layoutVersion的值是-41,它与Hadoop的发行版本号是两回事,如果layoutVersion的值变化了(通过减1变化,实际layoutVersion的值更小了),则如果能够读取原来旧版本的数据,必须执行一个升级(Upgrade)过程。layoutVersion主要在fsimage和edit日志文件、数据存储文件中使用。

⑤namespaceID

namespaceID唯一标识了HDFS,在格式化HDFS的时候指定了它的值。在HDFS集群启动以后,使用namespaceID来识别集群中的Datanode节点,也就是说,在HDFS集群启动的时候,各个Datanode会自动向Namenode注册获取到namespaceID的值,然后将该值存储在Datanode节点的VERSION文件中。

⑥cTime

cTime表示Namenode存储对象(即FSImage对象)创建的时间,但是在初始化时它的值为0。如果由于layoutVersion发生变化触发了一次升级过程,则会更新该事件字段的值。

⑦checkpointTime

checkpointTime用来控制检查点(Checkpoint)的执行,为了在集群中获取到同步的时间,使用通过调用FSNamesystem对象的的now方法来生成时间戳。Hadoop使用检查点技术来实现Namenode存储数据的可靠性,如果因为Namenode节点宕机而无法恢复数据,则整个集群将无法工作,我们必须杜绝这种事情的发生,进而采用检查点技术。

⑧in_use.lock锁文件

调用sd.lock()会创建一个${dfs.name.dir}/in_use.lock锁文件,用来保证当前只有同一个进程能够执行格式化操作

//in_use.lock文件中的数字是分别对应namenode和datanode节点中namenode、datanode的进程号


[root@datafactory name]# more in_use.lock 
5385@hadoop01.rc.com

[root@datafactory name]# jps
12820 PrestoServer
5735 DFSZKFailoverController
14424 RunJar
14233 RunJar
5385 NameNode
5866 ResourceManager
6783 Jps

 

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值