java对于office word文档的解决方案,读取,生成
word文档目前有两种格式doc、docx格式。
doc应该是微软闭源的格式,docx是开源的ooxml的格式。后者可以把文件类型改成zip,然后可以打开。
对于office比较友好的应该是自家的.net平台的C#。
java对于此也有解决方案:
apache的poi、商业公司的docx4j包含开源社区版。
docx其实就是使用xml组织出了一种zip格式的文档。正确使用并遵守规范,操作xml,最终就会生成一个可以由office或wps、openoffice等程序打开的文档。
这两个的中文文档资料都比较匮乏。