1011yarn配置

Flash2023

已于 2023-10-12 09:30:06 修改

阅读量81

点赞数 1

文章标签： yarn

于 2023-10-11 13:49:29 首次发布

本文链接：https://blog.csdn.net/m0_62868777/article/details/133759899

版权

1、下载虚拟机进程显示程序

因为之前sdkman下载的jdk不能显示进程，所以要更换jdk

进入yum源，用命令下载（此处的cloudera下载连接是老师的）

wget -c http://192.168.10.120/tools/jdk/cloudera-manager.repo

2、清除缓存

yum clean all

3、重新制作缓存

yum makecache

查看已安装的jdk

yum list installed |grep java

卸载它

yum -y remove java-1.8.0-openjdk.x86_64

查看可安装的cloudera

yum list |grep cloudera

安装cloudera

查看是否安装成功，安装成功

修改/root/.bashrc 文件，添加Java路径

export JAVA_HOME=/usr/java/jdk1.8.0_232-cloudera/

export PATH=$PATH:$JAVA_HOME/bin

激活刚刚的设置

source ~/.bashrc

查看当前进程，设置成功

2、yarn配置

在/root/server/hadoop-3.2.3/etc/hadoop/yarn-site.xml中<configuration>里添加以下代码

<name>yarn.resourcemanager.hostname</name>

</property>

<name>yarn.resourcemanager.webapp.address</name>

</property>

<name>yarn.log.server.url</name>

<value>http://qwd:19888/jobhistory/logs</value>

</property>

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

<name>yarn.nodemanager.resource.cpu-vcores</name>

</property>

<name>yarn.nodemanager.pmem-check-enabled</name>

<value>false</value>

</property>

<name>yarn.nodemanager.vmem-check-enabled</name>

<value>false</value>

</property>

<name>yarn.nodemanager.vmem-pmem-ratio</name>

</property>

<name>yarn.scheduler.minimum-allocation-mb</name>

</property>

<name>yarn.scheduler.minimum-allocation-vcores</name>

</property>

<name>yarn.scheduler.maximum-allocation-mb</name>

</property>

<name>yarn.scheduler.maximum-allocation-vcores</name>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.local-dirs</name>

<value>/yarn/local</value>

</property>

<name>yarn.nodemanager.log-dirs</name>

</property>

3、mapreduce 资源配置

在/root/server/hadoop-3.2.3/etc/hadoop/mapred-site.xml中<configuration>里添加以下代码

<name>mapreduce.framework.name</name>

<value>local</value>

</property>

<name>mapreduce.jobhistory.address</name>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

</property>

<name>yarn.app.mapreduce.am.resource.mb</name>

<discription>2 * 任务子进程资源</discription>

</property>

<name>yarn.app.mapreduce.am.command-opts</name>

</property>

<name>yarn.app.mapreduce.am.resource.cpu-vcores </name>

<discription>2 * 任务子进程资源</discription>

</property>

<name>mapreduce.am.max-attempts</name>

</property>

<name>mapreduce.map.cpu.vcores</name>

</property>

<name>mapreduce.map.memory.mb</name>

</property>

<name>mapreduce.map.java.opts</name>

</property>

<name>mapreduce.map.maxattempts</name>

<discription>表示 Reduce Task 最大失败尝试次数,这个配置默认是4 </discription>

</property>

<name>mapreduce.reduce.cpu.vcores</name>

</property>

<name>mapreduce.reduce.memory.mb</name>

</property>

<name>mapreduce.reduce.java.opts</name>

</property>

<name>mapreduce.reduce.maxattempts</name>

<discription>表示 Reduce Task 最大失败尝试次数,这个配置默认是4</discription>

</property>

<name>mapreduce.reduce.shuffle.memory.limit.percent</name>

<discription>单个 shuffle 消耗的内存占reduce 所有内存的比例,默认值为0.25</discription>

</property>

<name>mapreduce.task.io.sort.mb</name>

<discription>mr 中间数据的缓存大小,占用map申请的资源</discription>

</property>

<name>mapreduce.task.io.sort.spill.percent</name>

<discription>中间数据缓存达到比例写磁盘</discription>

</property>

<name>mapreduce.map.output.compress</name>

<value>false</value>

<discription>中间数据写磁盘时是否压缩</discription>

</property>

<name>mapreduce.jobhistory.intermediate-done-dir</name>

<value>hdfs:///hadoop/mr_history/done_intermediate</value>

<discription>mr 正在运行的日志存放位置hdfs</discription>

</property>

<name>mapreduce.jobhistory.done-dir</name>

<value>hdfs:///hadoop/mr_history/done</value>

<discription>mr 运行过的日志存放位置hdfs</discription>

</property>

<name>mapreduce.job.reduce.slowstart.completedmaps</name>

<discription>map task 完成一定比例启动 reduce</discription>

</property>

<name>yarn.app.mapreduce.am.job.reduce.rampup.limit</name>

<discription>maptask 完成之前,最多启动 reduce 比例</discription>

</property>

<name>yarn.app.mapreduce.am.job.reduce.preemption.limit</name>

<discription>map 暂时无法获取资源,最多可以抢占reduce比例</discription>

</property>

<name>mapreduce.task.io.sort.factor</name>

<discription>map 全部完成，有 map输出最大文件数</discription>

</property>

<name>mapreduce.reduce.shuffle.parallelcopies</name>

<discription>reduce 同时取 N 个 map 输出数据</discription>

</property>

4、启动yarn

yarn --daemon start resourcemanager

yarn --workers --daemon start nodemanager

mapred --daemon start historyserver

可以加上昨天hdfs的启动命令，启动之后用jps查看进程，出现如上情况则启动成功

5、尝试计算圆周率

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.3.jar pi 1000 1000

经过漫长的等待之后……出现如下结果

出现异常：org.apache.hadoop.ipc.RenoteException(java.io.IOException

出现原因：修改core-site.xml后没有清空缓存就格式化了，造成spaceID不一致

解决方法：先清空缓存，再格式化。具体方法见上一章

Flash2023

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1011yarn配置

因为之前sdkman下载的jdk不能显示进程，所以要更换jdk进入yum源，用命令下载2、清除缓存3、重新制作缓存查看已安装的jdk卸载它查看可安装的cloudera安装cloudera查看是否安装成功，安装成功修改/root/.bashrc 文件，添加Java路径激活刚刚的设置查看当前进程，设置成功。
复制链接

扫一扫