spark Hadoop 高可用模式下读写hdfs

最新推荐文章于 2023-06-02 10:22:32 发布

VIP文章 AA强

最新推荐文章于 2023-06-02 10:22:32 发布

阅读量573

点赞数 1

分类专栏： spark hadoop 文章标签： spark hadoop ha

本文链接：https://blog.csdn.net/gaoguiqiang0/article/details/95199455

版权

第一种，通过配置文件

  val sc = new SparkContext()

    sc.hadoopConfiguration.set("fs.defaultFS", "hdfs://ns");
    sc.hadoopConfiguration.set("dfs.nameservices", "ns");
    sc.hadoopConfiguration.set("dfs.ha.namenodes.ns", "nn1,nn2");
    sc.hadoopConfiguration.set("dfs.namenode.rpc-address.ns.nn1", "hadoop01:9000");
    sc.hadoopConfiguration.set("dfs.namenode.rpc-address.ns.nn2", "hadoop02:9000");
    sc.hadoopConfiguration.set("dfs.client.failover.proxy.provider.ns", "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider");

第二种，通过Java代码

   val conf = new SparkConf().setAppName("Spark Word Count") 
    val sc = new SparkContext()
    sc.hadoopConfiguration.addResource("ns/core-site.xml")
    sc.hadoopConfiguration.addResource("ns/hdfs-site.xml")

需要引入hadoop-hdfs包hadoop-client包

优惠劵

AA强

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark Hadoop 高可用模式下读写hdfs

第一种，通过配置文件 val sc = new SparkContext() sc.hadoopConfiguration.set("fs.defaultFS", "hdfs://ns"); sc.hadoopConfiguration.set("dfs.nameservices", "ns"); sc.hadoopConfiguration.set("dfs.h...
复制链接

扫一扫