这几天乘着工作之余,学习了一下hadoop技术,跌跌撞撞的几天,终于完成了一个初步的hadoop的安装及测试,具体如下:
动力:工作中遇到的数据量太大,服务器已经很吃力,sql语句运行老半天,故想用大数据技术来改善一下
环境:centos5.11+jdk1.7+hadoop2.5.2
1. 伪分布安装步骤
关闭防火墙
修改ip
修改hostname
设置ssh自动登录
安装jdk
安装hadoop
注:此部分涉及到的Linux操作部分可以再下面的链接中找到,Linux初级操作
2. 安装jdk
用xftp把jdk安装包放到/root/Downloads
tar xzvfjdk-7u67-linux-i586.tar.gz 解压缩
vi/etc/profile 设置环境变量,添加如下3行内容
exportJAVA_HOME=/usr/local/jdk1.7
exportCLASSPATH=/usr/local/jdk1.7/lib
exportPATH=.:$JAVA_HOME/bin:$PATH
source /etc/profile 配置文件立即生效
java –version 验证是否设置成功
3. 安装hadoop
用xftp把hadoop安装包放到/root/Downloads
tar xzvf hadoop-2.5.2.tar.gz 解压缩
<