编译工具中的 HDFS远程连接配置

最新推荐文章于 2024-05-15 02:52:03 发布

garlic_onion

最新推荐文章于 2024-05-15 02:52:03 发布

阅读量787

点赞数

分类专栏： hadoop MapReduce 文章标签： hadoop MapReduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39081169/article/details/83382607

版权

本文介绍了如何在IDEA中配置HDFS远程连接，以便直接运行MapReduce作业，无需将jar包拷贝到Hadoop集群。通过HadoopUtil工具类设置HDFS和YARN的相关配置，包括NameNode、ResourceManager等地址，然后在Job实例化时传入配置。示例展示了WordCount程序的Mapper和Reducer实现，通过配置后的Job对象运行作业。

摘要由CSDN通过智能技术生成

在configuration中配置了远程连接,可直接在编译工具上运行MapReduce,而不需要将jar打包拷到虚拟机中运行这种方法更方便

本人使用的是 IDEA

配置和使用如下

1.写一个工具类 HadoopUtil:

public class HadoopUtil {

//构建一个获取configuration静态方法

public static Configuration getRemoteHadoopConf(){

Configuration conf=getBaseRemoteHadoopConf();

conf.set("mapreduce.job.jar", "I:\\bigdata\\target\\bigdata-all.jar");//你项目打包所存放的地址

return conf;

}

//重载

public static Configuration getRemoteHadoopConf(String jarAbsPath){

Configuration conf=new Configuration();

conf.set("mapreduce.job.jar",jarAbsPath);

return conf;

}

private static Configuration getBaseRemoteHadoopConf(){

Configuration conf=new Configuration();

//!!!下面的配置是远程连接起作用的配置

//HDFS远程连接信息

conf.set("fs.defaultFS", "hdfs://mycluster"); // 集群逻辑名称 ,指定hdfs的nameservice为mycluster,与core-site.xml中的配置保持一致

conf.set("dfs.nameservices", "mycluster");

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。