POI读取Word文档总结

    本文档为个人总结,不作为指导性教程,未提供解决方案.

1 要解决表格,宏,超链接,图片等显示或者乱码问题,不能用类似WordExtractor的包或者试图用一个函数导出文本,没有现成的解决方案,必须用poi包一个段落一个段落的解析并处理一些特殊的格式。

2 现在对带数字或者符号的”项目符号和编号“无法解析和显示,只能显示文本

3 无法显示修订内容,无法判断哪些的新增的修改,最严重的是无法去掉已经删除的文字

4 分页的时候无法拆分表格,理论上可以解决,但是太花时间,而且取决与你显示表格的技术

5 无法获取word的分页位置;无法处理目录,暂时来说我只是删除了目录。

//*********************************************************

    腊月二十八,找到了判断记录痕迹的办法,判断分页位置应该也没有问题了,对于word2003来说POI应该算做的很细致了,不过缺少全面的例子。下面就是判断段落标志和编号了,PAP应该可以找到吧,注释太少了,不得不啃微软的说明书。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值