文档解析
somnus9298
这个作者很懒,什么都没留下…
展开
-
HSLF操作PPT
最近做到的一个项目,需要对ppt文档进行解析,网上找了半天也没有合适的中文文档,这里对poi的hslf进行的翻译翻译 2017-03-03 10:48:35 · 7865 阅读 · 0 评论 -
docx文档表格抽取(openoffice)
引子之前使用word去抽取word中table并转成png,过程和思路就不多赘述了。由于office的局限性,这里使用了openoffice去实现word抽取table的功能。1.因为通过setTable生成新的文档会出现样式丢失的情况,所以这里我们需要记录下table的index并且移除除了index位置的Element去获取新的table文档。/** * 获取表格数据 *原创 2017-07-04 10:41:59 · 1202 阅读 · 0 评论 -
docx文档表格抽取(word)
最近在做一个知识库系统,遇到了用户需求是要抽取出word中的表格。大家都知道用poi抽取出来的table没有格式只包含文本内容,所以这里我用 word表格提取—》表格单存为word-》word转pdf-》pdf转图片-》表格文本替换为图片url 这个思路来实现。话不多说,下面上代码原创 2017-06-29 17:04:15 · 1455 阅读 · 0 评论