YARN和HDFS的调用方式汇总

本文详细总结了调用YARN和HDFS的各种方法,包括命令行、JAVA API、REST API以及使用Oozie。对于YARN,介绍了通过命令行、JAVA API和REST APIs提交作业以及通过Oozie代理提交作业。在HDFS操作方面,概述了命令行、JAVA API和WebHDFS REST API的使用,涵盖了文件的增删改查和权限管理。
摘要由CSDN通过智能技术生成

YARN和HDFS的调用方式汇总

总结涉及到运行YARN和HDFS的几种方式,包括使用命令行,JAVA API,REST API,oozie等.


调用YARN的几种方式

1. 命令行方式

hadoop jar wordcount.jar hdfs_input hdfs_output

2. JAVA API

hadoop API docs包含了hadoop的全部包,针对YARN的API也包含其中。

3. 使用YARN REST APIS

通过YARN(MapReduceV2)提供的api,用户可以自定义提交作业,查看作业状态等,参见Hadoop YARN - Introduction to the web services REST API’s

以查看某个job运行状态为例,参见Cluster Application State API.用户查询id为"application_1399397633663_0003"的job的运行状态时,发送的Request和收到的Response如下,

  • HTTP Request

    GET http://<rm http address:port>/ws/v1/cluster/apps/application_1399397633663_0003/state
    
  • Response Header:

    HTTP/1.1 200 OK
    Content-Type: application/json
    Transfer-Encoding: chunked
    Server: Jetty(6.1.26)
    
  • Response Body:

    {
         "state":"ACCEPTED"
    }
    

4. 使用oozie

4.1 使用oozie代理提交作业

使用oozie来提交hadoop作业前,需配置hadoop的core-site.xml文件,如下所示,参见--Oozie Quick Start

    <!-- OOZIE -->
    <property>
        <name>hadoop.proxyuser.[OOZIE_SERVER_USER].hosts</name>
        <value>[OOZIE_SERVER_HOSTNAME]</value>
    </property>
    <property>
        <name>hadoop.proxyuser.[OOZIE_SERVER_USER].groups</name>
        <value>[USER_GROUPS_THAT_ALLOW_IMPERSONATION]</value>
    </property>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值