apache beam java api_java – 在Apache Beam中从GCS读取文件

好.如果您只想从GCS读取文件,而不是作为PCollection而是作为常规文件,并且如果您在使用GCS Java客户端库时遇到问题,您还可以使用Apache Beam

FileSystems API:

首先,您需要确保在beam-sdks-java-extensions-google-cloud-platform-core上的pom.xml中具有Maven依赖项,其中包含gs:// filesystem的实现:

org.apache.beam

beam-sdks-java-extensions-google-cloud-platform-core

然后设置FileSystems API(默认情况下,它在所有管道中设置,但如果您在管道外使用它,则需要手动执行).

PipelineOptions options = PipelineOptionsFactory.create();

// ...Optionally fill in options such as GCP credentials...

// (see GcpOptions class)

FileSystems.setDefaultPipelineOptions(options);

然后你可以使用它:

ReadableByteChannel chan = FileSystems.open(FileSystems.matchNewResource(

"gs://path/to/your/file", false /* is_directory */));

try (InputStream stream = Channels.newInputStream(chan)) {

// Use regular Java utilities to work with the input stream.

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值