Java调用Hadoop API

hadoop提供的Java API主要用来对文件操作。最常见的也就是读、写、遍历。

总的来说,调用API的第一步获取FileSystem,可以用FileSystem fs = FileSystem.get()来获取。接下来如果是写(上传)文件,则用fs.create(),如果是读(下载)文件,则用fs.get()。然后再用FSDataInputStream、FSDataOutputStream 具体代码如下:

package hadoop;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

public class HadoopFileSystem 
{
    public static final String HDFS_PATH = "hdfs://master:9000";
    public static void main(String[] args)
    {
        //readFile();
        //writeFile();
        listFile("/home/hadoop");
    }
     
    static void listFile(String listPath)
    {
        try
        {
            FileSystem fs = FileSystem.get(new URI(HDFS_PATH), new Configuration());
            FileStatus[] files = fs.listStatus(new Path(listPath));
            for (FileStatus f : files)
            {
                if (f.isDir())
                {
                    System.out.println("d " + f.getPath());
                    listFile(f.getPath().toString());
                }
                else
                {
                    System.out.println("- " + f.getPath());
                }
            }
        }
        catch (URISyntaxException e)
        {
            e.printStackTrace();
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
    }
    
    static void writeFile()
    {
        try
        {
            String path = "/home/hadoop/data/writefile/write.txt";
            FileSystem fs = FileSystem.get(new URI(HDFS_PATH), new Configuration());
            
            if ( fs.exists(new Path(path)) )
            {
                System.out.println("file already exist, delete it first...");
                fs.deleteOnExit(new Path(path));
            }
           
            FSDataOutputStream out = fs.create(new Path(path));
            InputStream in = new FileInputStream("C:/data.txt");
            IOUtils.copyBytes(in, out, 1024, true);
            
            System.out.println("**********write finished*******");
            
            FSDataInputStream i = fs.open(new Path(path));
            IOUtils.copyBytes(i, System.out, 1024, true);
            
        }
        catch (URISyntaxException e)
        {
            e.printStackTrace();
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
    }
    
    static void readFile() 
    {   
        try
        {
            String path = HDFS_PATH + "/home/hadoop/data/input/core-site.xml";
            FileSystem fs = FileSystem.get(URI.create(HDFS_PATH), new Configuration());
            FSDataInputStream in = fs.open(new Path(path));
            IOUtils.copyBytes(in, System.out, 1024, true);
        }
        catch (IOException e)
        {
            e.printStackTrace();
        }
    }
}

其中writeFile、readFile、listFile分别代表了写、读、列举。一般操作格式就是这个样子吧,先记下来再说。。。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值