本博客只记录本人在学习使用hadoop时候的步骤和知识。没有系统的学习hadoop的知识,只是一些使用方法。
1、hadoop只能执行jar包,所以用eclipse编程后要生成jar包。
2、用WINSCP将jar包放到服务器上某个文件夹,我自己是放在以自己名字命名的hcy中。
3、用putty连接到服务器 ,首先用 cd hadoop-1.2.1 (可用 Tab 自动拓展hadoop目录)
其他的一些hadoop命令可查http://www.cnblogs.com/gpcuster/archive/2010/06/04/1751538.html
4、 用图示命令执行jar包
bin/hadoop jar :jar命令 , bin/hadoop 表示jar命令的目录
../hcy/CountBookReader.jar : 要执行的jar包路径 ..表示返回上一层目录
CountBookReader :要执行的主类 如果有包名, 则要 包名.主类
/phj/output15/part-r-00000 :输入文件目录
/hcy/outTestBookReader :输出文件目录
bin/hadoop jar :jar命令 , bin/hadoop 表示jar命令的目录
../hcy/CountBookReader.jar : 要执行的jar包路径 ..表示返回上一层目录
CountBookReader :要执行的主类 如果有包名, 则要 包名.主类
/phj/output15/part-r-00000 :输入文件目录
/hcy/outTestBookReader :输出文件目录