HDFS的Java API操作

本文详细介绍了如何在Idea中通过Java API操作HDFS,包括引入HDFS依赖、配置HDFS访问路径、文件系统的基本操作如上传、下载、删除、重命名,以及递归获取所有文件的方法。同时,文章还涵盖了单元测试和HDFS的配置及异常处理。
摘要由CSDN通过智能技术生成

通过Java代码操作HDFS集群

目录

引言

Idea连接HDFS

第一步:引入HDFS依赖

第一种引入方式(jar包)

第二种引入方式(使用maven引用)

引入项目依赖的时候:

maven项目的几个核心的生命周期:

第二步:idea操作

配置HDFS的访问路径

单元测试

HDFS的JavaAPI基本操作

Maven依赖准备

hdfs文件系统的API使用

操作HDFS:

连接HDFS文件系统------是必备操作(见二、idea连接HDFS)

对HDFS进行操作

递归获取HDFS所有文件

FileSystem其他方法

IO流操作HDFS

利用IO流实现文件的上传和下载

利用IO流实现定位文件读取


引言

要想在Windows上操作HDFS,首先需要在Windows上安装HDFS。由于Hadoop官网没有提供Windows下载版本,所以需要对 Hadoop.tar.gz进行两次解压(推荐用7-zip软件),解压完成后添加相应环境变量:HADOOP_HOME、Path

Idea连接HDFS

第一步:引入HDFS依赖

第一种引入方式(jar包)

自己找jar包然后插入程序中(HDFS编程所需jar包都在Hadoop安装目录的share目录下,此处将jar包归类了三个文件夹

         导入到idea中:

 

第二种引入方式(使用maven引用)

maven项目创建后是如下结构:

          

                其中:

        src

               main

                javaJava源代码

                resourceJava中的一些静态紫竹院,如文件、图片、HTML文件等

               test

                Java:专门用来编写Java Junit单元测试代码

引入项目依赖的时候:

gav....
  scope:引入的依赖jar包的一个作用范围
  runtime:项目运行过程中也要使用
  test:项目在测试过程中才能去使用 
  provided:项目在编译时和运行时都起作用

maven项目的几个核心的生命周期:

 clean:清楚上一次编译的结果

compile:编译源代码
test:执行maven项目的test包下的单元测试代码
package:如果test阶段测试通过,那么将项目打包成对应的包
install
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值