大数据
文章平均质量分 79
牛鼻子光
互联网移动互联网大数据
展开
-
Hadoop2.2 单机测试程序WordCount
Hadoop wordcount程序是经典的hadoop入门测试程序,主要根据给出一堆文件file1、file2...,统计出file1、file2...中单词出现的次数。 我们在单机上测试运行这个程序,我的测试系统是Mac OS。 1 下载hadoop包,地址:http://www.apache.org/dyn/closer.cgi/hadoop/common/ 2 安装到任意原创 2013-12-10 08:29:23 · 613 阅读 · 0 评论 -
Eclipse下调试Hadoop2.2测试代码
Hadoop2.2已不自带Eclipse Plugin,此时如果在Eclipse上调试word count测试代码,不得不想想别的方法。 最简单的方法,就是将hadoop的所有依赖的jar,做成一个library,供测试调用。步骤如下: 1 下载hadoop 2 新建文件夹 hdlib,将 hadoop2.2/share/hadoop 中所依赖的jar,集中放在hdlib中(包括commo原创 2013-12-12 10:19:50 · 646 阅读 · 0 评论 -
Hadoop 简介
今天我们正在被数据包围,人们上传视频,更新微博,发网上留言、点击广告等等,这使得机器产生和保存了越来越多的数据,数据的指数级增长给一些大公司带来了新的挑战,Google率先推出了MapReduce,随后一些公司纷纷响应。在数据量剧增的同时,他们更看到了商业上的价值。 Hadoop 与众不同的几点在于: 1 方便:Hadoop运行在由一般商用机器构成的大型集群上,或者如亚马逊弹性云(原创 2013-12-10 08:27:36 · 516 阅读 · 0 评论