前面搭建好了hadoop的平台,然后我们可以使用简单的hadoop命令体验下hadoop,不至于搭建平台后不知道干嘛。
$ pwd
/home/opt/hadoop
格式化分布式文件系统
$ bin/hadoop namenode -format
启动hadoop的守护进程
$ bin/start-all.sh
停止hadoop的守护进程
$ bin/stop-all.sh
可用jps查看守护进程是否启动
jps
为了后边的演示,我在这里新建几个文件及目录~
$ mkdir input
$ cd input/
$ echo "hello world" > test1.txt
$ echo "hello hadoop" >test2.txt
将input目录复制到hdfs个根目录,并重命名为in,out为处理完成后输出目录(执行之前out必须为空,否则出错)
$ bin/hadoop dfs -put input in
$ bin/hadoop jar hadoop-exmples-1.0.1.jar wordcount in out
列出文档中的文件
$ bin/hadoop dfs -ls in
-rw-r--r-- 1 hadoop supergroup 12 2013-04-08 19:17 /user/hadoop/in/test1.txt
-rw-r--r-- 1 hadoop supergroup 13 2013-04-08 19:17 /user/hadoop/in/test2.txt
查看hdfs文件内容
$ bin/hadoop dfs -cat in/test1.txt
hello world
删除文件
bin/hadoop dfs -rm in/test1.txt
删除目录
bin/hadoop dfs -rmr in/input (假如hdfs的in目录下已经有了此目录)
当hdfs目录中的文件test2.txt下载到本地,并重命名为test.txt
$ bin/hadoop dfs -get in/test2.txt test.txt
管理与更新命令:
报告hdfs的基本统计信息
$ bin/hadoop dfsadmin -report
进入安全模式(安全模式下文件系统不允许修改)
$ bin/hadoop dfsadmin -safemode enter
Safe mode is ON
退出安全模式(等待若干秒生效)
$ bin/hadoop dfsadmin -safemode leave
Safe mode is OFF
启动负载均衡
$ bin/start-balancer.sh