spark中操作hdfs

最新推荐文章于 2024-04-24 15:02:12 发布

大怀特

最新推荐文章于 2024-04-24 15:02:12 发布

阅读量1.7k

点赞数

分类专栏： bigdata 文章标签： spark hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rustwei/article/details/120439953

版权

bigdata 专栏收录该内容

60 篇文章 1 订阅

订阅专栏

spark只是一个可扩展统一分析数据引擎,并没有对hdfs上具体上文件或目录的属性做处理,有这样需求最好也是调用hadoop filesystem的类来处理;

spark如果说可以处理hdfs文件也就只有读或者创建文件或目录操作而已.

    // 目录
    val pathStr = "hdfs://nameservice1/user/hive/warehouse/cdp.db/store_user_client_group/store_id=s50"
    val path = new Path(pathStr)

    var fileSystem: FileSystem = null

    try {
      fileSystem = org.apache.hadoop.fs.FileSystem.get(spark.sparkContext.hadoopConfiguration)
      // list出目录下的文件
      val listStatus = fileSystem.listStatus(path)
      listStatus.foreach(println)

      println("-------------------------")

      // 目录
      val pathStr2 = "hdfs://nameservice1/user/hive/warehouse/cdp.db/store_user_client_group/store_id=s50/group_id=q1383"
      val path2 = new Path(pathStr2)
      // 查看目录权限
      fileSystem.getFileStatus(path2)

    } catch {
      case e: Exception => println(e.getMessage)
    } finally {
      fileSystem.close()
    }

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark中操作hdfs

val conf = spark.sparkContext.hadoopConfigurationval path = new org.apache.hadoop.fs.Path("hdfs://xxx")val fs = path.getFileSystem(conf)
复制链接

扫一扫

专栏目录

大怀特 CSDN认证博客专家 CSDN认证企业博客

码龄3年

130: 原创

2万+: 周排名

2万+: 总排名

26万+: 访问

: 等级

1955: 积分

5078: 粉丝

56: 获赞

10: 评论

291: 收藏

私信

关注

热门文章

分类专栏

lang 37篇
team 1篇
OS 30篇
tools 51篇
graph 8篇
database 23篇
每天学点Rust 1篇
idea
stream 17篇
flink
bigdata 60篇
D-algorithm 3篇
software architecture 9篇
design 1篇
AI 3篇
cloud 1篇

最新评论

五笔输入法
Glowworm001: 学习了，谢谢
nebula graph 常用命令(updating)
一枚学习的菜鸟: 您好！为啥我在执行fetch prop on follow player101 -> player102, player102 -> player103;会出错呢
OpenSSH 入门
m0_73279122: github下的
OpenSSH 入门
m0_73279122: 下载了openssh，找不到powershell命令行，谁来救救我
Rust REPL Jupyter notebook
早上真好: 您好，请问应该怎样在这种交互式的环境中使用crate呢，是直接使用use引入还是有其他配置的地方？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大怀特 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。