Hadoop海量put时出现的socket超时导致put失败解决方案

最新推荐文章于 2021-03-07 20:42:36 发布

大数据框架Hadoop学习

最新推荐文章于 2021-03-07 20:42:36 发布

阅读量1k

点赞数

分类专栏： 2019年5月 2019年3月 2019年1月 2018年11月 2018年9月 2017年6月 2019年4月 2019年2月 2018年12月文章标签：大数据程序员编程语言 hadoop

本文链接：https://blog.csdn.net/qq_38460284/article/details/90271664

版权

当一个HDFS系统同时处理许多个并行的put操作，往HDFS上传数据时，有时候会出现dfsclient 端发生socket 链接超时的报错，有的时候甚至会由于这种原因导致最终的put操作失败，造成数据上传不完整。
log类似如下：

All datanodes *** are bad. Aborting...

类似这样的错误，常常会在并行的put操作比较多，比如 60-80个，每个put的数据量约100G的时候，产生类似的错误，错误出现以后，比较好一点的情况是DFSClient端会报出一些列的错误log，如：

error Recovery for block block_-13954o849583405 bad datanode ** "
Bad response for block block_-254u94545923 from datanode ***

10/01/18 18:48:00 WARN hdfs.DFSClient: Error Recovery for block blk_6828192944006126093_201296138 bad datanode[0] 172.23.115.79:50010
10/01/18 18:48:00 WARN hdfs.DFSClient: Error Recovery for block blk_6828192944006126093_201296138 in pipeline 172.23.115.79:50010, 172.23.115.68:50010: bad datanode 172.23.115.79:50010
10/01/18 18:48:27 WARN hdfs.DFSClient: DFSOutputStream ResponseProcessor exception for block blk_-1574627828968965286_201296769java.net.SocketTimeoutException: 63000 millis timeout while waiting for channel to be ready for read. ch : java .nio.channels.SocketChannel[connected local=/172.23.113.2:50391 remote=/172.23.114.41:50010]
at org.apache.Hadoop.net.SocketIOWithTimeo

最低0.47元/天解锁文章

大数据框架Hadoop学习

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop海量put时出现的socket超时导致put失败解决方案

当一个HDFS系统同时处理许多个并行的put操作，往HDFS上传数据时，有时候会出现dfsclient 端发生socket 链接超时的报错，有的时候甚至会由于这种原因导致最终的put操作失败，造成数据上传不完整。log类似如下：All datanodes *** are bad. Aborting...类似这样的错误，常常会在并行的put操作比较多，比如 60-80个，每个put的数...
复制链接

扫一扫