HDFS客户端操作

1 HDFS客户端环境准备

1.1 jar包准备

1)解压hadoop-2.7.2.tar.gz到非中文目录

2)进入share文件夹,查找所有jar包,并把jar包拷贝到_lib文件夹下

3)在全部jar包中查找sources.jar,并剪切到_source文件夹。

4)在全部jar包中查找tests.jar,并剪切到_test文件夹。

1.2 Eclipse准备

1)根据自己电脑的操作系统拷贝对应的编译后的hadoop jar包到非中文路径(例如:E:\02_software\hadoop-2.7.2)。(如果不生效,重新启动eclipse)

 

https://i-blog.csdnimg.cn/blog_migrate/8a4a0a2fd44140aa95a36d927ea4759e.png

https://i-blog.csdnimg.cn/blog_migrate/dbf095bb89cbd84d7851e7b3ef00bedf.png

2)配置HADOOP_HOME环境变量

 

https://i-blog.csdnimg.cn/blog_migrate/23ebd6948e8048fa375bc1d8f3005f8c.png

3)创建第一个java工程HdfsClientDemo1

4)创建lib文件夹,然后添加jar包

https://i-blog.csdnimg.cn/blog_migrate/989cf301453565703b11d70b8205fac1.png

5)创建包名:com.faded.hdfs

6)创建HdfsClient类

public class HdfsClient {

 

       // 上传文件

       public static void main(String[] args) throws IOException, InterruptedException, URISyntaxException {

 

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              // 配置在集群上运行

              // configuration.set("fs.defaultFS", "hdfs://hadoop102:9000");

              // FileSystem fs = FileSystem.get(configuration);

 

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

 

              // 2 上传文件

              fs.copyFromLocalFile(new Path("e:/hello.txt"), new Path("/hello2.txt"));

 

              // 3 关闭资源

              fs.close();

 

              System.out.println("over");

       }

}

7)执行程序

运行时需要配置用户名称

 

客户端去操作hdfs时,是有一个用户身份的。默认情况下,hdfs客户端api会从jvm中获取一个参数来作为自己的用户身份:-DHADOOP_USER_NAME=atguigu,atguigu为用户名称。

8)注意:如果eclipse打印不出日志,在控制台上只显示

1.log4j:WARN No appenders could be found for logger (org.apache.hadoop.util.Shell).  

2.log4j:WARN Please initialize the log4j system properly.  

3.log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

需要在项目的src目录下,新建一个文件,命名为“log4j.properties”,在文件中填入

log4j.rootLogger=INFO, stdout 

log4j.appender.stdout=org.apache.log4j.ConsoleAppender 

log4j.appender.stdout.layout=org.apache.log4j.PatternLayout 

log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n 

log4j.appender.logfile=org.apache.log4j.FileAppender 

log4j.appender.logfile.File=target/spring.log 

log4j.appender.logfile.layout=org.apache.log4j.PatternLayout 

log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n 

2 通过API操作HDFS

2.1 HDFS获取文件系统

1)详细代码

       @Test

       public void initHDFS() throws Exception{

              // 1 创建配置信息对象

              Configuration configuration = new Configuration();

             

              // 2 获取文件系统

              FileSystem fs = FileSystem.get(configuration);

             

              // 3 打印文件系统

              System.out.println(fs.toString());

       }

2.2 HDFS文件上传(测试参数优先级)

1)编写源代码

       @Test

       public void testCopyFromLocalFile() throws IOException, InterruptedException, URISyntaxException {

 

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              configuration.set("dfs.replication", "2");

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

 

              // 2 上传文件

              fs.copyFromLocalFile(new Path("e:/hello.txt"), new Path("/hello5.txt"));

 

              // 3 关闭资源

              fs.close();

 

              System.out.println("over");

}

2)将hdfs-site.xml拷贝到项目的根目录下

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 

<configuration>

       <property>

              <name>dfs.replication</name>

        <value>1</value>

       </property>

</configuration>

3)测试参数优先级

参数优先级: (1)客户端代码中设置的值 >(2)classpath下的用户自定义配置文件 >(3)然后是服务器的默认配置

2.3 HDFS文件下载

       @Test

       public void testCopyToLocalFile() throws IOException, InterruptedException, URISyntaxException{

             

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 执行下载操作

              // boolean delSrc 指是否将原文件删除

              // Path src 指要下载的文件路径

              // Path dst 指将文件下载到的路径

              // boolean useRawLocalFileSystem 是否开启文件效验

              fs.copyToLocalFile(false, new Path("/hello1.txt"), new Path("e:/hello1.txt"), true);

             

              // 3 关闭资源

              fs.close();

       }

2.4 HDFS目录创建

       @Test

       public void testMkdirs() throws IOException, InterruptedException, URISyntaxException{

             

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 创建目录

              fs.mkdirs(new Path("/0906/daxian/banzhang"));

             

              // 3 关闭资源

              fs.close();

       }

2.5 HDFS文件夹删除

       @Test

       public void testDelete() throws IOException, InterruptedException, URISyntaxException{

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 执行删除

              fs.delete(new Path("/0906/"), true);

             

              // 3 关闭资源

              fs.close();

       }

2.6 HDFS文件名更改

       @Test

       public void testRename() throws IOException, InterruptedException, URISyntaxException{

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 修改文件名称

              fs.rename(new Path("/hello.txt"), new Path("/hello6.txt"));

             

              // 3 关闭资源

              fs.close();

       }

2.7 HDFS文件详情查看

查看文件名称、权限、长度、块信息

       @Test

       public void testListFiles() throws IOException, InterruptedException, URISyntaxException{

              // 1获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 获取文件详情

              RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

             

              while(listFiles.hasNext()){

                     LocatedFileStatus status = listFiles.next();

                    

                     // 输出详情

                     // 文件名称

                     System.out.println(status.getPath().getName());

                     // 长度

                     System.out.println(status.getLen());

                     // 权限

                     System.out.println(status.getPermission());

                     // z组

                     System.out.println(status.getGroup());

                    

                     // 获取存储的块信息

                     BlockLocation[] blockLocations = status.getBlockLocations();

                    

                     for (BlockLocation blockLocation : blockLocations) {

                           

                            // 获取块存储的主机节点

                            String[] hosts = blockLocation.getHosts();

                           

                            for (String host : hosts) {

                                   System.out.println(host);

                            }

                     }

                    

                     System.out.println("--------------------------------");

              }

       }

2.8 HDFS文件和文件夹判断

       @Test

       public void testListStatus() throws IOException, InterruptedException, URISyntaxException{

             

              // 1 获取文件配置信息

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 判断是文件还是文件夹

              FileStatus[] listStatus = fs.listStatus(new Path("/"));

             

              for (FileStatus fileStatus : listStatus) {

                    

                     // 如果是文件

                     if (fileStatus.isFile()) {

                            System.out.println("f:"+fileStatus.getPath().getName());

                     }else {

                            System.out.println("d:"+fileStatus.getPath().getName());

                     }

              }

             

              // 3 关闭资源

              fs.close();

       }

3 通过IO流操作HDFS

3.1 HDFS文件上传

       @Test

       public void putFileToHDFS() throws IOException, InterruptedException, URISyntaxException {

 

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

 

              // 2 创建输入流

              FileInputStream fis = new FileInputStream(new File("e:/hello.txt"));

 

              // 3 获取输出流

              FSDataOutputStream fos = fs.create(new Path("/hello4.txt"));

 

              // 4 流对拷

              IOUtils.copyBytes(fis, fos, configuration);

 

              // 5 关闭资源

              IOUtils.closeStream(fis);

              IOUtils.closeStream(fos);

       }

3.2 HDFS文件下载

1)需求:从HDFS上下载文件到本地控制台上。

2)编写代码:

       @Test

       public void getFileFromHDFS() throws IOException, InterruptedException, URISyntaxException{

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 获取输入流

              FSDataInputStream fis = fs.open(new Path("/hello4.txt"));

             

              // 3 获取输出流

              IOUtils.copyBytes(fis, System.out, configuration);

              // 4 流对拷

             

              // 5 关闭资源

              IOUtils.closeStream(fis);

       }

3.3 定位文件读取

1)下载第一块

       @Test

       public void readFileSeek1() throws IOException, InterruptedException, URISyntaxException{

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 获取输入流

              FSDataInputStream fis = fs.open(new Path("/hadoop-2.7.2.tar.gz"));

             

              // 3 创建输出流

              FileOutputStream fos = new FileOutputStream(new File("e:/hadoop-2.7.2.tar.gz.part1"));

             

              // 4 流的拷贝

              byte[] buf = new byte[1024];

             

              for(int i =0 ; i < 1024 * 128; i++){

                     fis.read(buf);

                     fos.write(buf);

              }

             

              // 5关闭资源

              IOUtils.closeStream(fis);

              IOUtils.closeStream(fos);

       }

2)下载第二块

       @Test

       public void readFileSeek2() throws IOException, InterruptedException, URISyntaxException{

             

              // 1 获取文件系统

              Configuration configuration = new Configuration();

              FileSystem fs = FileSystem.get(new URI("hdfs://hadoop102:9000"), configuration, "atguigu");

             

              // 2 打开输入流

              FSDataInputStream fis = fs.open(new Path("/hadoop-2.7.2.tar.gz"));

             

              // 3 定位输入数据位置

              fis.seek(1024*1024*128);

             

              // 4 创建输出流

              FileOutputStream fos = new FileOutputStream(new File("e:/hadoop-2.7.2.tar.gz.part2"));

             

              // 5 流的对拷

              IOUtils.copyBytes(fis, fos, configuration);

             

              // 6 关闭资源

              IOUtils.closeStream(fis);

              IOUtils.closeStream(fos);

       }

3)合并文件

在window命令窗口中执行

type hadoop-2.7.2.tar.gz.part2 >> hadoop-2.7.2.tar.gz.part1

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值