the directory item limit is exceed: limit=1048576问题的解决

最新推荐文章于 2024-08-12 13:35:06 发布

sparkexpert

最新推荐文章于 2024-08-12 13:35:06 发布

阅读量5.5k

点赞数 1

分类专栏： HDFS 文章标签： hdfs 文件数目限制spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sparkexpert/article/details/51852944

版权

HDFS 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

当spark流式数据分析处理跑了一段时间之后，突然会出现报错，如下：

意思就是目录超过了HDFS的文件个数限制。

然而这个问题网上真的不太好找，在定位一番之后，终于明确就是HDFS本身的容量限制问题，而这个正常在配置里面是没有的，只有新增加一行配置才能生效，否则就是按照默认的1048576来处理。

<property>
<name>dfs.namenode.fs-limits.max-directory-items</name>
<value>1048576</value>
<description>Defines the maximum number of items that a directory may
contain. Cannot set the property to a value less than 1 or more than
6400000.</description>
</property>

把这个配置添加到hdfs-site.xml中，把值设置为大一些，问题搞定。

不过在此也存在一个问题，这个HDFS的限制有个范围，最多不能超过6400000，因此后续还要考虑到历史数据的删除。

做大数据就是各种坑。在数据不多的时候还真不好发现。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。