HDFS的应用开发

本文介绍了如何使用HDFS的Java API进行文件系统操作,包括配置开发环境、构建客户端对象以及示例代码。同时,文章还探讨了通过Linux crontab结合HDFS Shell命令实现实时上传网站日志数据至HDFS集群的解决方案,详细阐述了实现流程和代码实现。
摘要由CSDN通过智能技术生成

1. HDFS的JAVA API操作

HDFS在生产应用中主要是客户端的开发,其核心步骤是从HDFS提供的api中构造一个HDFS的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS上的文件。

1.1. 搭建开发环境

创建Maven工程,引入pom依赖

<dependencies>

                <dependency>

                        <groupId>org.apache.hadoop</groupId>

                        <artifactId>hadoop-common</artifactId>

                        <version>2.7.4</version>

                </dependency>

                <dependency>

                        <groupId>org.apache.hadoop</groupId>

                        <artifactId>hadoop-hdfs</artifactId>

                        <version>2.7.4</version>

                </dependency>

                <dependency>

                        <groupId>org.apache.hadoop</groupId>

                        <artifactId>hadoop-client</artifactId>

                        <version>2.7.4</version>

                </dependency>

        </dependencies>

        

配置windows平台Hadoop环境

在windows上做HDFS客户端应用开发,需要设置Hadoop环境,而且要求是windows平台编译的Hadoop,不然会报以下的错误:

Failed to locate the winutils binary in the hadoop binary path java.io.IOException: Could not loca

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值