Hadoop 运行自带worcount map0% reduce0% 和map100%和reduce 0%问题

今天跑了一下hadoop自带的wordcount 遇到了如下问题
我的配置是 VMware上hadoop的伪分布式安装
在这里插入图片描述

也就是map0%,reduce0%问题,网上的博客都翻了个遍,几乎都是修改yarn-site.xmal文件的各种配置,说是内存不足,资源分配等问题,由于本人还是小白,没有查询log的能力,也不知道具体问题出在哪里,最后的解决办法是:将虚拟机的能存由2G提到3G,分配了四个核,而其他的配置文件都没有修改,,修改了也是跑不出来,我的应该是内存的原因。

在这里插入图片描述

然后接下来就是 map100%,reduce 0%,同样小白也没有查看log的能力,故去博客逛了一圈,主要是hostname的问题,至于为什么这么改,还有待我去学习。
原先的主机名
上图是原先的主机名

在这里插入图片描述

上图是修改以后的主机名

修改以后重启

在运行就oK了

在这里插入图片描述

### Hadoop Map Reduce 进度停滞在 0% 的原因分析 Hadoop作业中`map 0% reduce 0%`的现象通常表明任务未能正常启动或执行遇到了障碍。具体来说,这种现象可能是由资源不足引起的,尤其是在内存交换空间方面存在问题[^3]。 #### 资源耗尽问题 当系统内存被大量占用时,尤其是Swap分区几乎用光的情况下,继续运行MapReduce任务可能导致计算机死机。这是因为操作系统为了腾出物理内存而频繁地将不活跃的数据页移至磁盘上的Swap区,从而显著降低性能并最终导致无法响应新请求。对于这种情况,增加系统的RAM容量以及扩大Swap分区可以有效缓解压力,防止由于内存瓶颈造成的计算节点崩溃或任务挂起。 ```bash sudo dd if=/dev/zero of=/swapfile bs=1G count=8 sudo chmod 600 /swapfile sudo mkswap /swapfile sudo swapon /swapfile ``` 上述命令用于创建额外的8GB Swap文件来扩充现有虚拟内存大小。 --- ### 解决方案概述 针对`map 0% reduce 0%`的问题,除了调整硬件配置外,还可以考虑优化软件层面的因素: - **检查集群状态**:确认所有DataNodeTaskTracker服务是否处于活动状态,并查看是否有任何异常错误消息记录于日志文件内。 - **数据分布均衡性评估**:如果某些节点上存储了过多的小文件,则可能会造成NameNode负担过重或是InputSplit分配不合理等问题。通过合理规划文件上传策略或者启用CombineFileInputFormat等方式改善这一情况。 - **参数调优建议** - 设置合理的IO.sort.mb、io.file.buffer.size等参数值以适应当前工作负载特性; - 减少并发度(如设置适当数量的任务实例),避免过度消耗CPU/Memory资源引发GC风暴或其他形式的竞争条件。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值