distributed data processing
文章平均质量分 69
robert_zhai
Life is short, cherish what we have owned !
My github is https://robertzhai.github.io 。
展开
-
hadoop php streming word count
alias hdfs ="hadoop fs " 1. 本地环境 [@ hadoop]# tree . |-- php | |-- data | | |-- a.txt | | |-- b.txt | | |-- c.txt | | |-- d.txt | | `-- e.txt | |-- mapper.php | `-原创 2013-09-06 18:23:49 · 650 阅读 · 0 评论 -
hadoop 视频教程
http://www.douban.com/group/topic/36364785/转载 2013-09-06 10:19:21 · 793 阅读 · 0 评论 -
hadoop 命令总结
1. 查看文件 hadoop fs -lsr 2. 创建文件夹 hadoop fs -mkdir /user/data 3. 删除文件夹 hadoop fs -rmr /user/data 5. 拷贝本地文件到远程机器 hdfs -copyFromLocal data /user/data 6. steaming cli /usr/bin/had原创 2013-09-06 18:56:28 · 596 阅读 · 0 评论 -
hadoop 进阶实例
三个文件 one.txt 格式如下 号码 标签 数量 two.txt 格式如下 号码 标签 数量 number.txt 133658207 需求是找出第三个文件中的号码,出现在前两个文件中的 号码 标签 数量 输出格式 号码 标签 数量 mapper.php #!/usr/bin/php error_report原创 2013-09-11 18:18:40 · 421 阅读 · 0 评论