spark访问OSS文件时POM文件配置和使用方法

最新推荐文章于 2024-03-15 15:54:46 发布

Just Jump

最新推荐文章于 2024-03-15 15:54:46 发布

阅读量920

点赞数 1

分类专栏： Scala开发日志 spark 文章标签： spark访问OSS POM文件配置

本文链接：https://blog.csdn.net/eylier/article/details/118555620

版权

spark 同时被 2 个专栏收录

74 篇文章 1 订阅

订阅专栏

Scala开发日志

28 篇文章 1 订阅

订阅专栏

1、spark如果要访问OSS文件，需要在POM.xml文件中添加一些依赖。

要添加的依赖是：

（1）hadoop-jfs

（2）jss-sdk-java

添加方法，在<dependencies>...</dependencies>中添加

           <dependency>
                <groupId>org.apache.hadoop</groupId>
                <artifactId>hadoop-jfs</artifactId>
                <version>${hadoop.jfs.version}</version>
            </dependency>

            <dependency>
                <groupId>com.${XXX你的公司的jss群组}.jss</groupId>
                <artifactId>jss-sdk-java</artifactId>
                <version>${jfs.version}</version>
            </dependency>

因为这里的版本使用了变量，所以在<properties>.... </properties>中添加版本变量。当然这里的版本都是你使用的公司开发的版本，请根据自己的情况来调整。

<jfs.version>1.4.2-SNAPSHOT</jfs.version>
<hadoop.jfs.version>2.0.2-SNAPSHOT</hadoop.jfs.version>

2、访问方法

上面配置完成后，接下来就可以使用fs.jfs.accessKey、fs.jfs.accessKey、fs.jfs.endPoint 来访问OSS文件了。

//in scala

object Test{
  def main(args: Array[String]): Unit = {
  val spark = SparkSession.builder()
              .appName("Test")
              .enableHiveSupport()
              .getOrCreate()
    val accessKey = "你的accessKey"
    val secretKey = "你的secretKey"
    val endPoint = "你的endPoint"
    val inputPath = "你的inputPath"
    spark.sparkContext.hadoopConfiguration.set("fs.jfs.accessKey", accessKey)
    spark.sparkContext.hadoopConfiguration.set("fs.jfs.secretKey", secretKey)
    spark.sparkContext.hadoopConfiguration.set("fs.jfs.endPoint", endPoint)
    spark.sparkContext.hadoopConfiguration.set("fs.jfs.impl", "org.apache.hadoop.fs.jfs.JFSFileSystem")

    spark.read.textFile(inputPath).show()

  }

}

我看到其他同事配置Key的时候，有使用另外方式的：

spark.conf.set("fs.jfs.accessKey", accessKey)
spark.conf.set("fs.jfs.secretKey", secretKey)
spark.conf.set("fs.jfs.endPoint", endPoint)

3、完成

Just Jump

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
spark访问OSS文件时POM文件配置和使用方法

1、spark如果要访问OSS文件，需要在POM.xml文件中添加一些依赖。要添加的依赖是：（1）hadoop-jfs（2）jss-sdk-java添加方法，在<dependencies>...</dependencies>中添加 <dependency> <groupId>org.apache.hadoop</groupId> <art
复制链接

扫一扫