粤飞的hadoop集群搭建

最新推荐文章于 2024-04-27 23:53:56 发布

笑出弧度的程序员

最新推荐文章于 2024-04-27 23:53:56 发布

阅读量206

点赞数

分类专栏：大数据文章标签：大数据

本文链接：https://blog.csdn.net/qq_40215851/article/details/108893401

版权

大数据专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、环境说明

环境：阿里云服务器 CentOS 7 x86_64

安装介质：jdk-7u75-linux-i586.tar.gz，hadoop-2.4.1.tar.gz

安装jdk

tar -zxvf jdk-7u75-linux-i586.tar.gz

配置环境变量：

# vi .bash_profileJAVA_HOME=/root/training/jdk1.7.0_75export JAVA_HOMEPATH=$JAVA_HOME/bin:$PATHexport PATH# source .bash_profile# which java# java -version

bug解决：64bit的操作系统，无法运行32bit的应用程序，需要安装32bit的glibc库。

-bash: /root/training/jdk1.7.0_75/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: No such file or directory

# yum install glibc*.i686# locate /lib/ld-linux.so.2# rpm -qf /lib/ld-linux.so.2

安装Hadoop

tar -zxvf hadoop-2.4.1.tar.gz

配置环境变量：

# vi .bash_profileHADOOP_HOME=/root/training/hadoop-2.4.1export HADOOP_HOMEPATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATHexport PATH# source .bash_profile

本地模式的配置

hadoop-env.sh JAVA_HOME /root/training/jdk1.7.0_75

# vi hadoop-env.shexport JAVA_HOME=/root/training/jdk1.7.0_75

修改hostname，/etc/hosts下的地址必须使用私有地址。

# vi /etc/hosts192.168.1.107 izwz985sjvpoji48moqz01z

验证mapreduce

# hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount ~/training/data/input/data.txt ~/training/data/output/# more part-r-00000

伪分布式模式配置

hadoop-env.sh JAVA_HOME /root/training/jdk1.7.0_75 Java的home目录 hdfs-site.xml dfs.replication 1 数据的冗余度 core-site.xml fs.defaultFS hdfs://<hostname>:9000 namenode的IP地址和端口，9000是RPC通信的端口 core-site.xml hadoop.tmp.dir /root/training/hadoop-2.4.1/tmp 如不修改默认为/tmp，设置的路径必须事先存在 mapred-site.xml mapreduce.framework.name yarn 指定MR运行在yarn上 yarn-site.xml yarn.resourcemanager.hostname <hostname> 指定YARN的老大（ResourceManager）的地址 yarn-site.xml yarn.nodemanager.aux-services mapreduce_shuffle reducer获取数据的方式

hdfs-site.xml

<property> <name>dfs.replication</name> <value>1</value></property>

core-site.xml

<property> <name>fs.defaultFS</name> <value>hdfs://192.168.1.107:9000</value></property><property> <name>hadoop.tmp.dir</name> <value>/root/training/hadoop-2.4.1/tmp</value></property>

mapred-site.xml，cp mapred-site.xml.template mapred-site.xml

<property> <name>mapreduce.framework.name</name> <value>yarn</value></property>

yarn-site.xml

<property> <name>yarn.resourcemanager.hostname</name> <value>192.168.1.107</value></property><property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value></property>

验证HDFS和mapreduce

# cd ~/trainging# ls hadoop-2.4.1/tmp/# hdfs namenode -format# start-all.sh# jps5828 NodeManager6284 Jps5438 SecondaryNameNode5288 DataNode5579 ResourceManager5172 NameNode# hdfs dfsadmin -report# hdfs dfs -mkdir /input# hdfs dfs -put data/input/data.txt /input/data.txt# hdfs dfs -lsr /# hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /input/data.txt /output# hdfs dfs -cat /output/part-r-00000# stop-all.sh# jps