因为项目需要解析文档,而且 doc 文档还不少,全网能找到的靠谱的解析doc甚至是将doc转txt的方案实际上不多。这个是部分文件统计
.Net 和 java 有一个收费的解决方案,但是我确实没钱spire.doc
C#有另外的微软解决方案,例如Microsoft word xxxx 14.0(中间内容忘了),但是这个实在配不起来,java的方案有两个,一个是 org.apache.poi 一个是com.jacob ,我用的就是第二个,原因是我只能找到第二个的代码,我不怎么会java,不是来引战那个库好用的。
正文开始
我的系统是 Windows10,java环境是 jdk 1.8.0_201
一、将 jacob-1.18-x64.dll/jacob-1.18-x86.dll到系统盘:\Windows\System32下,内容见压缩包<