跑任务的时候,报错剩余空间不足,看了一些东西。
hdfs上Non DFS Used:占了十几G,而DFS Remaining:只有几百兆,任务直接跑不了,
一开始想扩容,可是跟着网上教程新加磁盘容量挂载到了/disk,可是我的东西全在/home下,挂到/home直接覆盖了。也不知道怎么弄了。
再一想我机子也就spark hadoop和hibench,没道理20个G放不下,看了下文件大小
du -h查看本目录下的文件大小 发现问题在spark上 spark/work居然占了11G
他的作用是:使用spark standalone模式执行任务,每提交一次任务,在每个节点work目录下都会生成一个文件夹,
命名规则app-20180212191730-0249。该文件夹下是任务提交时,各节点从主节点下载的程序所需要的资源文件。 这些目录每次执行都会生成,且不会自动清理
对我每次提交的任务并没有影响,直接删除即可。这样一来磁盘还有11G,hdfs的剩余空间也大了很多。nice
- hdfs大小和啥有关呢
df-h查看所有文件系统大小