一、问题描述
使用solr检索doc、xls、txt等文件的时候,报错:
Exception in thread "main" org.apache.solr.client.solrj.impl.HttpSolrServer$RemoteSolrException: org.apache.tika.exception.TikaException: Error creating OOXML extractor
at org.apache.solr.client.solrj.impl.HttpSolrServer.executeMethod(HttpSolrServer.java:621)
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:228)
at org.apache.solr.client.solrj.impl.HttpSolrServer.request(HttpSolrServer.java:224)
at solr.ReadHadoopFile.indexFilesSolrCell(ReadHadoopFile.java:65)
at solr.ReadHadoopFile.main(ReadHadoopFile.java:25)
调试的时候,发现在提交ContentStreamUpdateRequest 时候报错!
ContentStreamUpdateRequest up = new ContentStreamUpdateRequest(
"/update/extract");
....
solr.request(up);
二、问题原因
一步一步调试,走发现读取一个docx文件的时候报错。百思不得解,而且这个报错网上没有类似的报错,痛苦思索,灵光一现考虑:是否会因为那个docx文档打开了,不能访问。赶紧关闭,发现一起ok,世界清净了!
三、解决办法
把打开的docx文件关闭,即可!