Hadoop入门系列1—— 安装,配置,编程,部署和运行

        Hadoop综述:将网格计算,并行计算和虚拟化等技术融为一体的云计算技术已经成为时下存储和处理海量数据的最佳选择之一。Hadoop的开源,高性能,高容错,跨平台等特点使其成为架构分布式云计算平台的首选,从而可以充分利用集群的计算与存储能力,完成对海量数据的处理。

        Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,以Hadoop分布式文件系统(HDFS)和MapReduce为核心的Hadoop为用户提供系统底层细节透明的分布式基础架构。HDFS的高容错性,高伸缩性等优点允许用户将Hadoop部署在低廉的硬件上形成分布式系统;MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下开发并行应用程序。

        说明一下我的开发环境
        操作系统:在win7下使用wubi安装了ubuntu 10.04

        hadoop版本:hadoop-0.20.2


在Linux上安装与配置Hadoop需要有两个前提:1.JDK1。6或更高版本 2.SSH(安全外壳协议),推荐安装OpenSSH

Hadoop是利用java开发的,Hadoop的编译与MapReduce运行都使用JDK,Hadoop通过SSH启动slave列表中各台主机的守护进程


命令行:sudo apt-get install sun-java6-jdk  下载JDK

sudo gedit /etc/profile,打开配置文件,在文件最下面配置环境变量

#set java environment

export JAVA_HOME=/home/wjm/jdk1.6/jdk1.6.0_16

export CLASSPATH=,;$JAVA_HOME/lib.tools.jar

export PATH= $JAVA_HOME/bin:$PATH

h验证JDK是否安装成功 命令行 java -version



在配置Hadoop之前,必须先配置ssh,因为Hadoop通过ssh来管理它的节点.配置SSH免密码登录

$ sudo apt-get install ssh                     //一般ssh会在当前用户下创建.ssh这个隐藏文件

$ ssh-keygen -t rsa                              //输入三个回车,将密码设为空

$ cat /home/wjm/.ssh/id_rsa.pub >> /home/wjm/.ssh/authorized_keys //这一步是让你能够用SSH访问本地计算机

$ ssh localhost      //测试ssh

安装Hadoop,Hadoop有三种运行方式:单节点方式,单机伪分布式和集群模式,本文针对的是伪分布式模式的配置。

进入hadoop-0.20.2文件夹的conf,修改配置文件hadoop-env.sh,添加export JAVA_HOME=JDK安装地址

hadoop 0.20中并不存在conf/hadoop-site.xml文件使用高版本的hadoop就要修改下面的配置:

  1. 配置  
  2. 使用如下的 conf/core-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>fs.default.name</name>  
  7.     <value>hdfs://localhost:9000</value>  
  8.   </property>  
  9. </configuration> 
  1. 配置  
  2. 使用如下的 conf/hdfs-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>dfs.replication</name>  
  7.     <value>1</value>  
  8.   </property>  
  9. </configuration> 
  1. 配置  
  2. 使用如下的 conf/mapred-site.xml:  
  3.   
  4. <configuration>  
  5.   <property>  
  6.     <name>mapred.job.tracker</name>  
  7.     <value>localhost:9001</value>  
  8.   </property>  
  9. </configuration> 
至此伪分布式模式的Hadoop安装已经基本完成



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值