1、对hdfs的操作方式:hadoop fs fs *****
hadoop fs -ls / 查看hdfs的跟目录下的内容
hadoop fs -lsr / 递归hdfs的根目录下的内容
hadoop fs mkdir /d1 在hdfs上创建文件夹
hadoop fs -put xxx ****** 把linux数据从xxxxx上次到hdfs目录******下
hadoop fs -get xxxx ****** 把数据从hdfs下载到linux特定路径
hadoop fs -text 查看hdfs中的文件
hadoop fs -rm 删除hdfs中的文件
hadoop fs -rmr 删除hdfs中的文件夹
2、HDFS的datanode在存储数据时,如果原始文件大小>64mb,按照64mb切分,反之直接占用64mb
3、RPC(remote procedure call)
不同的java进程间的对象方法的调用
一方称作服务端(server),一方称作客户端(client),
server端提供对象,供客户端调用的。被调用的对象的方法的执行发生在server
RPC是hadoop框架运行的基础,
4、通过rpc小例子获得的认识?
服务端通过的对象是一个接口,接口extends VersionedProtocal
客户端能过的对象中的方法必须位于对象的接口中,
cat
-
hadoop fs -cat hdfs://host1:port1/file1 hdfs://host2:port2/file2 -
hadoop fs -cat file:///file3 /user/hadoop/file4
返回值:
成功返回0,失败返回-1。
chgrp
使用方法:hadoop fs -chgrp [-R] GROUP URI [URI …] Change group association of files. With -R, make the change recursively through the directory structure. The user must be the owner of files, or else a super-user. Additional information is in the Permissions
User Guide. –>
chmod
使用方法:hadoop fs -chmod [-R] <MODE[,MODE]… | OCTALMODE> URI [URI …]
chown
使用方法:hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]
copyFromLocal
使用方法:hadoop fs -copyFromLocal <localsrc> URI
copyToLocal
使用方法:hadoop fs -copyToLocal [-ignorecrc] [-crc] URI <localdst>
cp
使用方法:hadoop fs -cp URI [URI …] <dest>
示例:
-
hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2 -
hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir
返回值:
du
使用方法:hadoop fs -du URI [URI …]
示例:
hadoop fs -du /user/hadoop/dir1 /user/hadoop/file1 hdfs://host:port/user/hadoop/dir1
返回值:
成功返回0,失败返回-1。
dus
使用方法:hadoop fs -dus <args>
expunge
使用方法:hadoop fs -expunge
get
使用方法:hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>
-
hadoop fs -get /user/hadoop/file localfile -
hadoop fs -get hdfs://host:port/user/hadoop/file localfile
返回值:
getmerge
使用方法:hadoop fs -getmerge <src> <localdst> [addnl]
ls
使用方法:hadoop fs -ls <args>
文件名 <副本数> 文件大小 修改日期 修改时间 权限 用户ID 组ID
如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下:
目录名 <dir> 修改日期 修改时间 权限 用户ID 组ID
示例:
hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile
返回值:
成功返回0,失败返回-1。
lsr
使用方法:hadoop fs -lsr <args>
ls命令的递归版本。类似于Unix中的ls -R。
mkdir
使用方法:hadoop fs -mkdir <paths>
-
hadoop fs -mkdir /user/hadoop/dir1 /user/hadoop/dir2 -
hadoop fs -mkdir hdfs://host1:port1/user/hadoop/dir hdfs://host2:port2/user/hadoop/dir
返回值:
movefromLocal
使用方法:dfs -moveFromLocal <src> <dst>
mv
使用方法:hadoop fs -mv URI [URI …] <dest>
示例:
-
hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2 -
hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1
返回值:
put
使用方法:hadoop fs -put <localsrc> … <dst>
-
hadoop fs -put localfile /user/hadoop/hadoopfile -
hadoop fs -put localfile1 localfile2 /user/hadoop/hadoopdir -
hadoop fs -put localfile hdfs://host:port/hadoop/hadoopfile -
hadoop fs -put - hdfs://host:port/hadoop/hadoopfile
从标准输入中读取输入。
返回值:
rm
使用方法:hadoop fs -rm URI [URI …]
示例:
-
hadoop fs -rm hdfs://host:port/file /user/hadoop/emptydir
返回值:
rmr
使用方法:hadoop fs -rmr URI [URI …]
示例:
-
hadoop fs -rmr /user/hadoop/dir -
hadoop fs -rmr hdfs://host:port/user/hadoop/dir
返回值:
setrep
使用方法:hadoop fs -setrep [-R] <path>
-
hadoop fs -setrep -w 3 -R /user/hadoop/dir1
返回值:
stat
使用方法:hadoop fs -stat URI [URI …]
-
hadoop fs -stat path
返回值:
成功返回0,失败返回-1。
tail
使用方法:hadoop fs -tail [-f] URI
-
hadoop fs -tail pathname
返回值:
成功返回0,失败返回-1。
test
使用方法:hadoop fs -test -[ezd] URI
-e 检查文件是否存在。如果存在则返回0。
-z 检查文件是否是0字节。如果是则返回0。
-d 如果路径是个目录,则返回1,否则返回0。
-
hadoop fs -test -e filename
text
使用方法:hadoop fs -text <src>
touchz
使用方法:hadoop fs -touchz URI [URI …]
-
hadoop -touchz pathname
返回值:
成功返回0,失败返回-1。