Java API操作HDFS文件

5 篇文章 0 订阅

版权声明:未经允许,随意转载,请附上本文链接谢谢(づ ̄3 ̄)づ╭❤~
https://blog.csdn.net/xiaoduan_/article/details/79687700

Java API操作HDFS文件


package coom.anthony.hadoop.hdfs;

import org.apache.hadoop.fs.*;
import org.apache.hadoop.io.IOUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.util.Progressable;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.net.URI;

/**
 * @Description: hadoop hdfs java API测试
 * @Date: Created in 14:01 2018/3/24
 * @Author: Anthony_Duan
 */
public class HDFSAPPTEST {

    public static final String HDFS_PATH = "hdfs://localhost:8020";
    FileSystem fileSystem = null;
    Configuration configuration = null;


    /**
     * 创建文件夹
     * @throws Exception
     */
    @Test
    public void mkdir()throws Exception{
        fileSystem.mkdirs(new Path("/hdfsapi/test"));
    }

    /**
     * 创建文件
     * @throws Exception
     */
    @Test
    public void create() throws Exception{

        FSDataOutputStream ouput = fileSystem.create(new Path("/hdfsapi/test/a.txt"));
        ouput.write("hello hadoop".getBytes());
        ouput.flush();
        ouput.close();

    }

    /**
     * 查看HDFS文件的内容
     * @throws Exception
     */
    @Test
    public void cat() throws Exception{
        FSDataInputStream in  = fileSystem.open(new Path("/hdfsapi/test/a.txt"));
        IOUtils.copyBytes(in,System.out,1024);
        in.close();
    }



    /**
     * 重命名
     */
    @Test
    public void rename() throws Exception {
        Path oldPath = new Path("/hdfsapi/test/a.txt");
        Path newPath = new Path("/hdfsapi/test/b.txt");
        fileSystem.rename(oldPath, newPath);
    }

    /**
     * 从本地上传文件到HDFS
     * @throws Exception
     */
    @Test
    public void copyFromLocalFile() throws Exception{
        Path localPath = new Path("/Users/duanjiaxing/myhexo/db.json");
        Path hdfsPath = new Path("/hdfsapi/test");
        fileSystem.copyFromLocalFile(localPath,hdfsPath);
    }


    /**
     * 带进度条的上传
     * @throws Exception
     */
    @Test
    public void copyFromLocalFileWithProgress()throws Exception{
        InputStream in = new BufferedInputStream(
                new FileInputStream(
                        new File("/Users/duanjiaxing/software/kafka_2.11-0.9.0.0.tgz")
                )
        );
        FSDataOutputStream output = fileSystem.create(new Path("/hdfsapi/test/software"),
                new Progressable() {
                    public void progress() {
                        System.out.print(".");
                    }
                }
        );
        IOUtils.copyBytes(in,output,4096);
    }

    /**
     * 下载HDFS文件
     * @throws Exception
     */
    @Test
    public void copyTolocalFile()throws Exception{
        Path localPath = new Path("/Users/duanjiaxing/Desktop");
        Path hdfsPath = new Path("/hdfsapi/test/software/kafka_2.11-0.9.0.0.tgz");
        fileSystem.copyToLocalFile(hdfsPath,localPath);
    }

    /**
     * 查看某个文件目录下所有文件
     * @throws Exception
     */
    @Test
    public void listFile() throws Exception{
        FileStatus[] fileStatuses = fileSystem.listStatus(new Path("/"));
        for (FileStatus fileStatus:fileStatuses){
            String isDir = fileStatus.isDirectory()?"文件夹":"文件";
            short replication = fileStatus.getReplication();//文件的副本信息
            long len = fileStatus.getLen();//文件大小
            String path = fileStatus.getPath().toString();//全路径

            System.out.println(isDir+"\t"+replication+"\t"+len+"\t"+path);
        }
    }

    /**
     * 递归删除文件
     * @throws Exception
     */
    @Test
    public void delete() throws Exception{
        fileSystem.delete(new Path("/hdfsapi/test/software/kafka_2.11-0.9.0.0.tgz"),true);
    }

    @Before
    public void setU() throws Exception{
        System.out.print("HDFSAPPtest.setUp");
        configuration = new Configuration();
//      这里可以传入用户名,我使用的是Mac本机上的hadoop,用户名是一样的,如果不是,需要传入用户名参数
        fileSystem = FileSystem.get(new URI(HDFS_PATH),configuration);


    }

    @After
    public void tearDown() throws Exception{
        configuration = null;
        fileSystem = null;
        System.out.println("HDFSApp.tearDown");
    }

}
  1. 如果你是通过hdfs shell的方式put的上去的那么,才采用默认的副本系数为配置文件中的参数,这里的配置文件中的副本系数是 1
  2. 如果我们是java api上传上去的,在本地我们并没有手工设置副本系数,所以采用的
    是hadoop自己的默认的副本系数是 3
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值