1.背景
在运行flink的时候报错,参考:
然后在Yarn界面上看到如下
2.原因分析
之所以会有 local-dirs are bad
,log-dirs are bad
报错,是因为在我们集群的 yarn-site.xml 里参数 yarn.nodemanager.disk-health-checker.max-disk-utilization-per-disk-percentage
的默认值是 90%,到达到这个值会触发上述报错。
- 客户的数据是存储在 Storage 里的,在进行计算之前需要将数据先读取到各个节点,客户在读取数据生成 RDD 之后对 RDD 的缓存采用的是
MEMORY_AND_DISK_2
,也没有采用序列化的方式,也就是说如果内存存不下会存到本地磁盘,而且会存在不同的节点上存 2 份。 <