python hdfs,通过 Python 使用 HDFS API 读取文件

通过 Python 使用 HDFS API 读取文件Use the HDFS API to read files in Python

03/23/2020

本文内容

有时你可能想直接读取文件而不使用第三方库。There may be times when you want to read files directly without using third party libraries. 当你的常规存储 Blob 无法用作本地 DBFS 装载时,这对于读取小文件很有用。This can be useful for reading small files when your regular storage blobs are not available as local DBFS mounts.

将以下示例代码用于 Azure Blob 存储。Use the following example code for Azure Blob storage.

URI = sc._gateway.jvm.java.net.URI

Path = sc._gateway.jvm.org.apache.hadoop.fs.Path

FileSystem = sc._gateway.jvm.org.apache.hadoop.fs.FileSystem

conf = sc._jsc.hadoopConfiguration()

conf.set(

"fs.azure.account.key..blob.core.windows.net,

"")

fs = Path('wasbs://@.blob.core.windows.net//').getFileSystem(sc._jsc.hadoopConfiguration())

istream = fs.open(Path('

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值