hadoop中本机和集群跑的结果不一样

最新推荐文章于 2023-06-05 15:34:00 发布

warden2

最新推荐文章于 2023-06-05 15:34:00 发布

阅读量364

点赞数

文章标签： hadoop mapreduce

本文链接：https://blog.csdn.net/a384310064/article/details/105893982

版权

hadoop中本机和集群跑的结果不一样

问题描述
解决方法

问题描述

我在写kmeans算法的时候，将Mapper和Reducer函数写到一个Kmeans方法内，首先在本机上跑，结果是通过的，然后在服务器上跑，出现了无效的结果。这个让我调试了快一个下午，终于发现了问题。

问题在于我给Kmeans方法设了一个全局变量feature_num。然后仅在map的setup中重写从conf中读取了feature_num，用来表征特征数量。但是问题就在这里，如果是本机跑，那么map和reduce方法都会使用一个全局变量。而在集群下，不同的class会被拆出来单独进行作业计算，因此reduce内feature_num为null。

解决方法

办法是设定全局变量后，在map和reduce的setup中都进行赋值。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

warden2

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop中本机和集群跑的结果不一样

hadoop中本机和集群跑的结果不一样问题描述解决方法问题描述我在写kmeans算法的时候，将Mapper和Reducer函数写到一个Kmeans方法内，首先在本机上跑，结果是通过的，然后在服务器上跑，出现了无效的结果。这个让我调试了快一个下午，终于发现了问题。问题在于我给Kmeans方法设了一个全局变量feature_num。然后仅在map的setup中重写从conf中读取了feature...
复制链接

扫一扫