hadoop map reduce 跑个案例挖坑二

最新推荐文章于 2023-10-02 01:04:25 发布

「已注销」

最新推荐文章于 2023-10-02 01:04:25 发布

阅读量155

点赞数 1

本文链接：https://blog.csdn.net/xt83750959/article/details/97736564

版权

先启动机器
切换到hadoop目录下

在这里插入图片描述
启动成功后

查看端口
这里要主要我是云服务器的话要把端口打开（如果要访问）

在你的云上输入外网ip 然后和你的运行端口后
先配置你的hosts文件

nn: core-site.xml
<configuration>
    <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoop001:9000</value>
   </property>
</configuration>
snn:
<property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>hadoop001:50090</value>
</property>
<property>
             <name>dfs.namenode.secondary.https-address</name>
            <value>hadoop001:50091</value>
</property>

现在 nn 和snn 都配置好了

可以启动了

如何用 jps
上一篇博客说过了
jps后可以看端口号
这里要注意的是经常所在的用户查看如果不是经常所在的用户会显示
process information unavailable
但是这个进程是不是真的运行着不行用jps 还是要用 netstat -nlp|grep
现在配置 pid存储目录

生产上，pid目录放/tmp真的合适吗？这个是个面试题目
因为 /tmp里面默认会30天删除所以自己创建一个
mkdir -p /data/tmp
chmod -R 777 /data/tmp
但是如果是CDH 就不用关心

用mapreduce 做个 wc案例最经典的一个例子
首先先配置 map reduce
etc/hadoop/mapred-site.xml:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

etc/hadoop/yarn-site.xml:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

然后启动