HDFS的Java API操作

通过Java代码操作HDFS集群

目录

引言

Idea连接HDFS

第一步:引入HDFS依赖

第一种引入方式(jar包)

第二种引入方式(使用maven引用)

引入项目依赖的时候:

maven项目的几个核心的生命周期:

第二步:idea操作

配置HDFS的访问路径

单元测试

HDFS的JavaAPI基本操作

Maven依赖准备

hdfs文件系统的API使用

操作HDFS:

连接HDFS文件系统------是必备操作(见二、idea连接HDFS)

对HDFS进行操作

递归获取HDFS所有文件

FileSystem其他方法

IO流操作HDFS

利用IO流实现文件的上传和下载

利用IO流实现定位文件读取


引言

要想在Windows上操作HDFS,首先需要在Windows上安装HDFS。由于Hadoop官网没有提供Windows下载版本,所以需要对 Hadoop.tar.gz进行两次解压(推荐用7-zip软件),解压完成后添加相应环境变量:HADOOP_HOME、Path

Idea连接HDFS

第一步:引入HDFS依赖

第一种引入方式(jar包)

自己找jar包然后插入程序中(HDFS编程所需jar包都在Hadoop安装目录的share目录下,此处将jar包归类了三个文件夹

         导入到idea中:

 

第二种引入方式(使用maven引用)

maven项目创建后是如下结构:

          

                其中:

        src

               main

                javaJava源代码

                resourceJava中的一些静态紫竹院,如文件、图片、HTML文件等

               test

                Java:专门用来编写Java Junit单元测试代码

引入项目依赖的时候:

gav....
  scope:引入的依赖jar包的一个作用范围
  runtime:项目运行过程中也要使用
  test:项目在测试过程中才能去使用 
  provided:项目在编译时和运行时都起作用

maven项目的几个核心的生命周期:

 clean:清楚上一次编译的结果

compile:编译源代码
test:执行maven项目的test包下的单元测试代码
package
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值