Hadoop
文章平均质量分 77
进击的鼻孔猫
立志成为Fintech领域专家
展开
-
Ubuntu14.04下安装Hadoop2.4.0 (单机模式)
一、在Ubuntu下创建hadoop组和hadoop用户 增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。 1、创建hadoop用户组 2、创建hadoop用户 sudo adduser -ingrou转载 2014-10-14 15:18:32 · 818 阅读 · 0 评论 -
基于Eclipse的Hadoop应用开发环境配置
我的开发环境:操作系统centos5.5 一个namenode 两个datanodeHadoop版本:hadoop-0.20.203.0Eclipse版本:eclipse-java-helios-SR2-linux-gtk.tar.gz(使用3.7的版本总是崩溃,让人郁闷)第一步:先启动hadoop守护进程具体参看:http://www.cnblogs.co转载 2014-10-14 15:21:37 · 658 阅读 · 0 评论 -
hadoop学习之WordCount.java代码解读
[java] view plaincopypackage org.apache.hadoop.examples; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import o转载 2014-10-14 15:22:29 · 666 阅读 · 0 评论 -
hadoop倒排索引---学习
1.前言 学习hadoop的童鞋,倒排索引这个算法还是挺重要的。这是以后展开工作的基础。首先,我们来认识下什么是倒拍索引: 倒排索引简单地就是:根据单词,返回它在哪个文件中出现过,而且频率是多少的结果。这就像百度里的搜索,你输入一个关键字,那么百度引擎就迅速的在它的服务器里找到有该关键字的文件,并根据频率和其他一些策略(如页面点击投票率)等来给你返回结果转载 2014-10-14 15:32:57 · 695 阅读 · 0 评论 -
hadoop中倒排索引的实践
倒排索引是文档检索系统中最常用的数据结构,被广泛的应用于全文搜索引擎。它主要用来存储某个单词(或词组),在一个文档或一组文档中的存储位置的映射,即提供了一种根据内容来查找文档的方式,由于不是根据文档来确定文档所包含的内容,而是进行了相反的操作,因而被称为倒排索引。原创 2014-10-14 19:20:55 · 1022 阅读 · 0 评论 -
Hadoop-1.2.1安装HBase(伪分布模式)
我是在hadoop1.2.1版本的基础上安装Hadoop加上0.94.16版本的hbase原创 2014-10-15 21:19:48 · 1851 阅读 · 0 评论 -
Hadoop-1.2.1安装HBase(单机模式)
HBase0.98.6 稳定版下载地址为:http://mirror.bit.edu.cn/apache/hbase/stable/原创 2014-10-15 16:08:16 · 2291 阅读 · 0 评论