本人写的如何使用DFS API 合并为一个大的天气数据文件

本人写的如何使用DFS API 合并为一个大的天气数据文件:

package com.zk.hadoop;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

public class AirTemperatureDataTranslate {

        public static byte[] buffer = new byte[4096];
        
        public AirTemperatureDataTranslate() {
                // TODO Auto-generated constructor stub
        }

        /**
         * @param args
         */
        public static void main(String[] args) {
                // TODO Auto-generated method stub
                
                String localPath = args[0];
                String dfsPath = args[1];
                
                File localDir = new File(localPath);
                
                FileInputStream input = null; 
                FSDataOutputStream fsOutput = null;
                
                Configuration conf = new Configuration();
                try {
                        FileSystem fs = FileSystem.get(new URI(dfsPath), conf);
                        fsOutput = fs.create(new Path(dfsPath));
                        if(localDir.isDirectory()){
                                System.out.println("处理目录:" + localDir.getName());
                                File[] fileArr = localDir.listFiles();
                                for(File tmp : fileArr){
                                        oper(tmp, input, fsOutput, conf);
                                }
                        }else{
                                System.out.println("处理文件:" + localDir.getName());
                                input = new FileInputStream(localDir);
                                write(input, fsOutput);
                        }
                } catch (IOException e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                } catch (URISyntaxException e) {
                        // TODO Auto-generated catch block
                        e.printStackTrace();
                } finally{
                        if(fsOutput != null) IOUtils.closeStream(fsOutput);
                        if(input != null) IOUtils.closeStream(input);
                }
                
        }
        
        /**
         * 递归扫描处理文件
         * @param file
         * @param input
         * @param output
         * @param conf
         * @throws IOException
         */
        public static void oper(File file, FileInputStream input, FSDataOutputStream output, Configuration conf) throws IOException{
                if(file.isDirectory()){
                        File[] fileArr = file.listFiles();
                        for(File tmp : fileArr){
                                oper(tmp, input, output, conf);
                        }
                }else{
                        System.out.println("处理文件:" + file.getName());
                        input = new FileInputStream(file);
                        write(input, output);
                }
        }
        
        /**
         * 写入DFS 输出流
         * @param input
         * @param output
         * @throws IOException
         */
        public static void write(FileInputStream input, FSDataOutputStream output) throws IOException{
                int readSize = 0;
                while((readSize = input.read(buffer)) > 0){
                        output.write(buffer, 0, readSize);                
                }
        }
        
}

说明:运行指定天气数据本地目录和合并后的HDFS上的文件名称即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值