在做solr4.7.2离线索引的时候,删除旧的索引文件和index.properties.old文件的时候,这2中文件依然存在硬盘中不释放,而且随着每次的删除操作积累下来。
使用lsof /diskb | grep -i delete可以查看到大批文件句柄和空间未释放。
在solrCore的handle处理器代码中发现几个这种写法的文件流:
Properties using = new Properties();
using.load(new FileInputStream(new File(indexProperties));
和
new IndexSearcher(new StandardIndexReaderFactory().newReader(directory, core)).search(new MatchAllDocsQuery(), 1).totalHits;
这里2个文件流都使用的是匿名类创建,它的关闭交给了引用它的类的生命周期。
这种方式,如果是正常情况下,也没什么问题,关键是solrCore的生命周期有点不一样,在solrCore reload的操作时,旧的core依然存在,等没有请求时才释放,而且释放时间无法预知,这就导致你新的core起来时做delete文件操作时,旧的core里的文件流FileInputStream或者newReader还存在,在window环境下的话,是直接不让删除;但是在linux环境下,文件会删除,但是空间不释放,类似于存放在回收站,而且这些文件是进程级别的,直接跟solr node的jvm进程挂钩,进程消失才释放。
解决方法是:不使用匿名类的文件流,
Properties using = new Properties();
FileInputStream usingFis = new FileInputStream(new File(indexProperties));
using.load(usingFis);
usingFis.close();
第二个也一样:
IndexReader iReader = new StandardIndexReaderFactory().newReader(directory, core);
...
iReader .close();
显示创建,自己关闭,这也是一种比较好的编码习惯,如果是流的套接,倒没多大问题,
类似:os = new OutputStreamWriter(new PropertiesOutputStream(out);
os.close()时,依赖的流自己会关闭。