本地多级文件 原样上传到hdfs

package com.hdfs;


import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocalFileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;


import com.beicai.utils.MyUtils;
/**
 * 
 * @described 本地多级文件 原样上传到hdfs
 */
public class HdfsWork {


public static void main(String[] args) throws Exception {
myMerge();
System.out.println("ok");
}

public static void myWrite(Path path,LocalFileSystem lfs,FileSystem fs) throws Exception{
FileStatus[] fst = lfs.listStatus(path);
for(int i=0;i<fst.length;i++){
Path dir = fst[i].getPath();//获取路径
//file:/D:/data/a
dir = new Path(dir.toString().split(":")[2]);//截取相对本地磁盘D盘的绝对路径

if(fst[i].isDirectory()){//是文件夹

myWrite(fst[i].getPath(),lfs,fs);//调用本身
fs.mkdirs(dir);//创建里面没有文件的文件夹(空文件夹)
} else {
FSDataInputStream fsdis = lfs.open(fst[i].getPath()); //打开文件输入流
FSDataOutputStream fsdos = fs.create(dir);//打开文件输出流流

int read = 0;
byte[] buffer = new byte[255];
while((read=fsdis.read(buffer))>0){
fsdos.write(buffer, 0, read);
}

IOUtils.closeStream(fsdis);//关闭流
IOUtils.closeStream(fsdos);
}
}
}

public static void myMerge() throws Exception{
FileSystem fs = MyUtils.getFileSystem();
LocalFileSystem lfs = MyUtils.getLocalFileSystem();
Path localPath = new Path("D:/datas");//本地路径


myWrite(localPath,lfs,fs);//调用方法
}
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要将Linux本地文件传到HDFS,可以使用以下命令: ``` hadoop fs -put /本地文件路径 /HDFS文件路径 ``` 其中,/本地文件路径是要上传的本地文件的路径,/HDFS文件路径是要上传到HDFS文件的路径。 例如,如果要将本地文件/home/user/file.txt上传到HDFS的/user/hadoop目录下,可以使用以下命令: ``` hadoop fs -put /home/user/file.txt /user/hadoop/ ``` 这将把本地文件file.txt上传到HDFS的/user/hadoop目录下。 ### 回答2: 在将本地文件传到HDFS之前,需要先确保在本地机器上已经安装了Hadoop并且已经启动了HDFS服务。在本地机器上,我们可以使用命令行或者Hadoop WebUI界面来上传文件。 1. 使用命令行上传文件HDFS (1)在本地创建一个新文件夹,并将待上传的文件储存在该文件夹中。 (2)使用以下命令将本地文件传到HDFS: `hdfs dfs -put /path/to/local/file /path/to/hdfs/directory` 其中,`/path/to/local/file` 是本地文件的路径,`/path/to/hdfs/directory` 是HDFS上的目录路径。 (3)输入命令后,系统会自动将本地文件传到HDFS中指定的目录中。 2. 使用Hadoop WebUI上传文件HDFS (1)打开Hadoop WebUI界面,并登录。 (2)选择“File Browser”选项,进入HDFS文件浏览器。 (3)在左侧栏中选择要将文件传到的目录。 (4)在右侧栏中选择“Upload”选项,在弹出的窗口中点击“Browse”按钮,选择本地文件并确认选择。 (5)点击“Upload”按钮,系统会自动将本地文件传到HDFS中指定的目录中。 无论是使用命令行还是Hadoop WebUI,上传文件的过程都比较简单,但需要注意的是,上传的文件必须符合HDFS文件系统的规则,否则将会上传失败。同时,在上传之前,也需要先确保HDFS系统的可用性和文件上传的权限。 ### 回答3: HDFS(Hadoop Distributed File System)是Hadoop中非常重要的一个组成部分,它是一个分布式文件系统,在存储大规模数据集时具有很高的可靠性、可扩展性和高吞吐量。在Hadoop中,很多数据的处理和分析都是基于HDFS文件系统的,因此在使用Hadoop时,HDFS的使用也是非常重要的。 在Linux系统中,如果我们需要将本地文件传到HDFS,一般需要通过hadoop客户端工具进行操作。以下是一个常规的上传文件的步骤: 1. 获得hadoop客户端工具所在的路径。在Linux系统中,可以通过使用“which hadoop”命令来找到hadoop客户端工具的安装路径,并记录该路径。 2. 进入本地文件所在的目录。使用命令“cd 文件路径”进入到本地文件所在的目录。 3. 执行hdfs上传命令。使用hadoop客户端工具中的hdfs命令,执行文件上传命令。例如,将本地文件test.txt上传到HDFS中的/user/hadoop/test目录中的命令为: hdfs dfs -put test.txt /user/hadoop/test/ 执行该命令后,文件就会被上传到HDFS中。 需要注意的是,在执行上传命令时,上传目录必须已经存在,否则上传操作将会失败。此外,如果上传的文件名在HDFS中已经存在,也需要指定覆盖操作,否则上传操作也会出现异常。在上传大量的文件时,建议使用命令行中的通配符*来进行指定,可以避免重复操作。 总之,通过hadoop客户端工具,将Linux本地文件传到HDFS非常简单。只需要按照上面的步骤操作即可。上传文件HDFS是Hadoop生态系统中常用的操作之一,具有很重要的使用价值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值