Hadoop
ibmfashion
这个作者很懒,什么都没留下…
展开
-
Hadoop是什么?
谈到Hadoop就不得不提到Lucene和Nutch。首先,Lucene并不是一个应用程序,而是提供了一个纯Java的高性能全文索引引擎工具包,它可以方便的嵌入到各种实际应用中实现全文搜索/索引功能。Nutch是一个应用程序,是一个以Lucene为基础实现的搜索引擎应用,Lucene为Nutch提供了文本搜索和索引的API,Nutch不光有搜索的功能,还有数据抓取的功能。在nutch0.8.0版本原创 2012-08-06 09:57:00 · 682 阅读 · 0 评论 -
Hadoop实战-初级部分 之 开启云计算之旅 第一部分:我们为什么要学习云计算技术
第一部分:我们为什么要学习云计算技术•“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。” ———哈佛大学 社会学教授加里·金 •一分钟内,微博推特( Twitter)上新发的数据数超过10万;社交网络“脸谱”(Facebook)的浏览量超过600万……•这些庞大数字,意味着什么?转载 2012-09-04 16:58:22 · 2353 阅读 · 0 评论 -
初识hadoop
1.什么是hadoop ? hadoop是一个高度容差的分布式文件系统,采用Master/Slave结构.由HDFS,MapReduce,HBase,Hive,ZooKeeper组成,是Sun的Apache下的项目.2.hadoop为什么会出现? 随着现代各类技术的发展,应用产生的数据与日据增.而数据存储密度增大的速度要远大于数据传输增大的速度. 处理这类问题转载 2012-09-04 17:05:20 · 668 阅读 · 0 评论 -
三台主机建立Hadoop小集群
部署环境:OS:Redhat 5.5 EnterpriseJDK:jdk1.6.0_32Hadoop:Hadoop-0.20.2VMWare:7.0节点安排及网络拓扑:节点类型节点IP节点hostnamemaster节点 192.168.40.5masterslave节点 192.168.40.5ma转载 2013-10-26 21:03:14 · 824 阅读 · 0 评论