hadoop

一.Hadoop Streaming用法
Usage: $HADOOP_HOME/bin/hadoop jar \
$HADOOP_HOME/contrib/streaming/hadoop-*-streaming.jar [options]
options:
(1)-input:输入文件路径
(2)-output:输出文件路径
(3)-mapper:用户自己写的mapper程序,可以是可执行文件或者脚本
(4)-reducer:用户自己写的reducer程序,可以是可执行文件或者脚本
(5)-file:打包文件到提交的作业中,可以是mapper或者reducer要用的输入文件,如配置文件,字典等。
(6)-partitioner:用户自定义的partitioner程序
          (7)-combiner:用户自定义的combiner程序(必须用java实现)
1.-D开头的都在前面
2.mapreduce中加载json模块需要python26指令
3.input中可以是文件也可以是目录
4.多文件输出
     将结果分成多个文件输出,在streaming中:
     -Dsuffix.multiple.outputformat.filesuffix=new,old \这里可自定义更改
     -Dsuffix.multiple.outputformat.separator="#" \
     -outputformat org.apache.hadoop.mapred.lib.SuffixMultipleTextOutputFormat \

     reducer里写:print“hello #old”,结果会打到文件old-r-000*
     如果输出没有\t 在后面手动加一个\t


二.hadoop查找和停止任务
1. hadoop job -list|grep hadoop_jobname
job_201706211123_1464501        1       1498015434934   hdp-map NORMAL  default hdp-map i-yanxinrui_probe16_from_hive
2.hadoop job -kill  job_201706211123_1464501

三.hadoop fs 命令
hadoop fs -cat URI [URI …]    将路径指定文件的内容输出到 stdout 。可以是多个文件
hadoop fs -text <src>    将源文件输出为文本格式。允许的格式是zip和TextRecordInputStream。
hadoop fs -tail [-f] URI   将文件尾部1K字节的内容输出到stdout。支持-f选项,行为和Unix中一致。

hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>    复制文件到本地文件系统
hadoop fs -put <localsrc> ... <dst>    从本地文件系统中复制单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。

hadoop fs -cp URI [URI …] <dest>  将文件从源路径复制到目标路径(都在hdfs上)。这个命令允许有多个源路径,此时目标路径必须是一个目录。
hadoop fs -mv URI [URI …] <dest> 将文件从源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。
hadoop fs -du URI [URI …]      显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小
hadoop fs -ls <args>     如果是文件,则按照如下格式返回文件信息: 文件名 <副本数> 文件大小 修改日期 修改时间 权限 用户ID 组ID  
                                                    如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下  目录名 <dir> 修改日期 修改时间 权限 用户ID 组ID  
hadoop fs -rmr URI [URI …]      递归  删除指定的文件
hadoop fs -test -[ezd] URI      选项: -e 检查文件是否存在。如果存在则返回0。 -z 检查文件是否是0字节。如果是则返回0。   -d 如果路径是个目录,则返回1,否则返回0。

hadoop fs -count -q /home/hdp-map   会打印出集群信息


python 对group不太兼容,可以换成python2.6


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值