Hadoop是由Apache基金会所开发的分布式系统基础架构。它的核心概念主要有两个:
- HDFS分布式文件系统,为海量数据提供存储
- MapReduce计算框架,为海量数据提供了计算途径
现在Hadoop已经成为了一种生态,并且其底层的HDFS为许多数据库的底层实现,例如Hbase,就是DataBase on Hadoop,也就是基于Hadoop的数据库。由于后面数据的存储需要使用Hbase以及OpenTsdb,因此必须首先安装Hadoop。这篇文章不会讲解Hadoop的各种概念,只会讲解Hadoop的安装方式。如果需要了解Hadoop的基础概念,可以参考这篇博文:Hadoop 系列(一)基本概念。
一、下载与安装
版本:2.6.0-cdh5.7.0
安装包:hadoop-2.6.0-cdh5.7.0.tar.gz或者直接在官网上下载,地址为:
wget http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz
下载完安装包后,开始进行安装
## 下载hadoop安装包
wget http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz
## 解压
tar -zvxf hadoop-2.6.0-cdh5.7.0.tar.gz
## 设置软链接
ln -s /Users/liumenghao/bigData/hadoop-2.6.0-cdh5.7.0 /opt/hadoop
## 设置环境变量,在文件中添加下述内容
vim ~/.zshrc
#hadoop
export HADOOP_HOME=/opt/hadoop
export PATH