[转] hadoop使用中的几个小细节(二)

最新推荐文章于 2023-03-14 19:58:54 发布

itstarting

最新推荐文章于 2023-03-14 19:58:54 发布

阅读量93

点赞数

分类专栏： hadoop及云计算文章标签： Hadoop Linux Java Apache Mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/itstarting/article/details/83490347

版权

hadoop及云计算专栏收录该内容

5 篇文章 0 订阅

订阅专栏

[转] hadoop使用中的几个小细节(二)

转自：http://rdc.taobao.com/blog/dw/archives/245

十二月 07, 2008 By: 竹庄 Category: hadoop, 所有

1 某次正常运行mapreduce实例时,抛出错误

java.io.IOException: All datanodes xxx.xxx.xxx.xxx:xxx are bad. Aborting…

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.processDatanodeError(DFSClient.java:2158)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.access$1400(DFSClient.java:1735)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:1889)

java.io.IOException: Could not get block locations. Aborting…

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.processDatanodeError(DFSClient.java:2143)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.access$1400(DFSClient.java:1735)

at org.apache.hadoop.dfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:1889)

经查明，问题原因是linux机器打开了过多的文件导致。用命令ulimit -n可以发现linux默认的文件打开数目为1024，修改/ect/security/limit.conf，增加hadoop soft 65535

再重新运行程序（最好所有的datanode都修改），问题解决

P.S:据说hadoop dfs不能管理总数超过100M个文件，有待查证

2 运行一段时间后hadoop不能stop-all.sh的问题，显示报错

no tasktracker to stop ，no datanode to stop

问题的原因是hadoop在stop的时候依据的是datanode上的mapred和dfs进程号。而默认的进程号保存在/tmp下，linux默认会每隔一段时间（一般是一个月或者7天左右）去删除这个目录下的文件。因此删掉hadoop-hadoop-jobtracker.pid和hadoop-hadoop-namenode.pid两个文件后，namenode自然就找不到datanode上的这两个进程了。

在配置文件中的export HADOOP_PID_DIR可以解决这个问题

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[转] hadoop使用中的几个小细节(二)

[转] hadoop使用中的几个小细节(二) 转自：http://rdc.taobao.com/blog/dw/archives/245 十二月 07, 2008 By: 竹庄 Category: hadoop, 所有 1 某次正常运行mapreduce实例时,抛出错误java.io.IOException: All datanodes xxx.xxx.xxx...
复制链接

扫一扫

专栏目录

itstarting CSDN认证博客专家 CSDN认证企业博客

码龄23年

18: 原创

47万+: 周排名

89万+: 总排名

2万+: 访问

: 等级

430: 积分

2: 粉丝

2: 获赞

7: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

工作流引擎是否应该建立在有限状态机（Finite State Machine, FSM）引擎之上？
shuishouhcd: 让我开眼界了，之前弄工作流就知道 jbpm,activities 也知道二者的流程设计语言 bpmn。这个wfmc还是第一次听说。不清楚 jbpm,activities 是否满足 wfmc 规范。我也认为fsm能够用来做wfmc的事情，尤其是复杂多变的审批流程操作。
Apache Cassandra Learning Step by Step (5): 实战性的JTwissandra项目
itstarting: 引用「第一个问题，我暂时采用了方案一，土办法。因为对于方案二而言：1. Super CF根本解决不了问题；...」 POST UPDATE: 其作者Patricio Echague建议使用MicrosecondsSyncClock，而非MicrosecondsClockResolution。其原理也很简单：如果一个毫秒内大于一次以上调用，第二次开始，每次调用在long类型的timestamp上加1 参考讨论：https://groups.google.com/forum/?fromgroups#!topic/hector-users/IfABWOh0HLg 所以最后的代码是： [code=java] /** * REF: * 1. FAQ * http://wiki.apache.org/cassandra/FAQ#working_with_timeuuid_in_java * 2. DISCUSSION: * https://groups.google.com/forum/?fromgroups#!topic/hector-users/IfABWOh0HLg * * @return UUID */ public UUID getUUID(){ ClockResolution clock = new MicrosecondsSyncClockResolution(); return TimeUUIDUtils.getTimeUUID(clock); } [/code]
Apache Cassandra Learning Step by Step (5): 实战性的JTwissandra项目
itstarting: 第一个问题，我暂时采用了方案一，土办法。因为对于方案二而言：1. Super CF根本解决不了问题；2. Super CF是一种有争议的概念，很可能会被废掉下面是第二个问题：我发现uuid会重复，导致循环调用addTweet后的实际tweet数量，少于预期的数量(e.g. 100次循环，预期产生100个tweet，而实际上只有不到90个）。为什么？因为如果是相同的tweet_uuid的话，就算用mutator.addInsertion，一样会replace掉（好比RDBMS的update）这块涉及的问题代码是： [code=java] /** * REF: http://wiki.apache.org/cassandra/FAQ#working_with_timeuuid_in_java * * @return UUID */ public UUID getUUID(){ //TODO: which UUID should we use to make sure it's unique? ClockResolution clock = new MicrosecondsClockResolution(); return TimeUUIDUtils.getTimeUUID(clock); //return TimeUUIDUtils.getUniqueTimeUUIDinMillis(); } [/code] 从我引用的讨论和作者Patricio Echague的说法来看，如果一个毫秒内可能产生多次调用的话，建议用TimeUUIDUtils.getTimeUUID(clock)。然而结果不是这样的，为什么？待解，打算直接跟作者沟通一下，可能是用法不当
Apache Cassandra Learning Step by Step (5): 实战性的JTwissandra项目
itstarting: 第一个问题发现在getTweets里： [code=java] public List<Tweet> getTweets(List<String> tweet_uuids){ MultigetSliceQuery<String, String, String> multigetSlicesQuery = HFactory.createMultigetSliceQuery(KEYSPACE, SERIALIZER_STRING, SERIALIZER_STRING, SERIALIZER_STRING); multigetSlicesQuery.setColumnFamily(CF_TWEET); multigetSlicesQuery.setColumnNames("user_uuid","tweet_content"); multigetSlicesQuery.setKeys(tweet_uuids); QueryResult<Rows<String, String, String>> results = multigetSlicesQuery.execute(); return convertRowsToTweets(results.get()); } [/code] 该问题是：如果通过MultigetSliceQuery.setKeys(Iterable<String> keys)传入系列key以进行批量的slice query，其结果并不依赖于keys的顺序，而是依赖于所在CF的建模。也就是说，通过CF_TIMELINE找到了漂亮的排序良好的tweet uuid，如果要获得同样排序良好的tweet列表，必须： 1. 一个一个的找，比如使用ColumnQuery，然后add到结果列表去； 2. CF_TWEET也要考虑通过timestamp来进行Column的排序——跟CF_TIMELINE一样方案一的做法感觉不怎么可取：这意味着需要跟Cassandra交互次数，瞬间X10倍方案二需要考虑一下，从感觉上来看，Super CF再说难免——这个需要进一步验证一下
Jetspeed2 Security
Swestheiyun: 相当不错的帖子，收获很大，谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。