hadoop快速入门,伪分布式模式安装

1、准备原料

jdk-7u79-linux-i586.tar.gz ,hadoop-1.2.1.tar.gz,linux版本centOS6.5

2、安装jdk

解压tar包 
tar -zxvf jdk-7u79-linux-i586.tar.gz

  配置jdk环境变量: 
  
 vi /etc/profile


增加下面配置:
export JAVA_HOME=/usr/java/jdk1.7.0_79
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

使配置生效:
source profile

查看是否安装成功
java -version


3、安装hadoop

解压
tar -zxvf hadoop-1.2.1.tar.gz
   配置hadoop 环境变量
vi /etc/profile
增加下面配置:
export HADOOP_HOME=/opt/modules/hadoop-1.2.1
export PATH=$HADOOP_HOME/bin:$PATH


4、运行测试hadoop-examples-1.2.1.jar 程序

   创建input,和output文件夹:  
mkdir input
mkdir output

   拷贝conf下的xml文件到input 目录:
cp conf/*.xml input
   
   运行hadoop命令:
hadoop jar /opt/modules/hadoop-1.2.1/hadoop-examples-1.2.1.jar grep /opt/data/input/ /opt/data/output/ 'dfs[a-z.]+'


   此时会报一个异常:org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory     file:/opt/data/output already exists
   经分析原来是:hadoop 由于进行的是耗费资源的计算,生产的结果默认是不能被覆盖的,
   因此中间结果输出目录一定不能存在,否则出现这个错误。 把output文件夹删除就可以拉。
   执行删除命令
rm -rf output


   在运行
hadoop jar /opt/modules/hadoop-1.2.1/hadoop-examples-1.2.1.jar grep /opt/data/input/ /opt/data/output/ 'dfs[a-z.]+'

   查看output文件夹_SUCCESS 说明成功
cat part-00000
   统计dfsadmin 只出现了一次


  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值