Parallel Computation
文章平均质量分 89
xiejava
这个作者很懒,什么都没留下…
展开
-
【转】海量数据战争——谁能赢得未来?
转自http://cloud.csdn.net/a/20110329/294800.html时至今日,海量数据时代的来临已经毋庸置疑,尤其是在互联网、电信、金融等行业,几乎已经到了“数据就是业务本身”的地步。在这其中,还挟裹着一个更为重要的趋势,即数据的社会化,这也是我们通常所说的非结构化数据。以往人们认为,把企业自有的运营数据进行深度分析后,自然会有所得。但在今天看来,这种做法的一大缺陷就是,数据不够全面、及时。从理论上讲,谁掌握的数据越全面,得出的结论就越趋向于合理。企业只有构建一个容纳了足够多关键信息转载 2011-03-30 11:54:00 · 855 阅读 · 0 评论 -
Hadoop学习笔记汇总
初学者最好的中文入门资料。但是这个资料是针对0.18.2版本的,所以对于高版本的用户,有些地方需要注意,安装Hadoop伪分布式模式建议参考这篇文章。hadoop安装成功后,就可以开始跑一跑系统自带的WordCount实例了,参考这篇文章。原创 2011-04-08 17:15:00 · 713 阅读 · 0 评论 -
Hadoop安装教程——单机(伪分布)模式
转自:http://bbs.chinacloud.cn/archiver/showtopic-589.aspxHadoop是MapReduce的开源实现,现在介绍它的单机模式安装方法。实验平台:Ubuntu 10.04,Hadoop0.20,JDK1.6转载 2011-04-06 18:41:00 · 1523 阅读 · 0 评论 -
Hadoop使用问题集锦
hadoop使用过程中遇到的问题原创 2011-04-13 09:53:00 · 787 阅读 · 0 评论 -
HadoopDB集群配置方法
参考此文:http://icymarywei.blog.163.com/blog/static/1275081022010116115917861/本文介绍在2个节点上安装配置HadoopDB方法。各节点的名称分别为Cluster01(192.168.0.1),Cluster02(192.168.0.2),以下若是用 hadoop@Cluster0X:~ 代表 Cluster01 ~ Cluster02 都要做的.1 首先在各节点上安装Hadoop-0.20.2,参考此文。2 各节点安裝设置 Postg原创 2011-04-13 16:21:00 · 1867 阅读 · 6 评论 -
Hbase学习笔记汇总
hbase介绍Hive入门3–Hive与HBase的整合原创 2011-04-19 11:09:00 · 933 阅读 · 0 评论 -
Hadoop中TeraSort算法分析
1TB排序通常用于衡量分布式数据处理框架的数据处理能力。Terasort是Hadoop中的的一个排序作业,在2008年,Hadoop在1TB排序基准评估中赢得第一名,耗时209秒。那么Terasort在Hadoop中是怎样实现的呢?本文主要从算法设计角度分析Terasort作业。转载 2011-04-27 11:46:00 · 852 阅读 · 0 评论 -
Hadoop0.21.0编译方法
本文介绍在Linux下使用eclipse编译Hadoop0.21.0源码原创 2011-05-04 11:37:00 · 1314 阅读 · 0 评论