使用POI拆分word文档并转成html在页面展示
需求:导入word文档,按照目录进行拆分并转换成html,将目录及应内容保存到数据库,通过赋值到富文本编辑器在页面展示。2、.docx需要POI XWPFDocument进行解析,同时将图片进行本地保存,遍历段落获取目录列表。4、通过Jsoup读取html文件,获取页面元素,删除空白行,删除标号,替换图片访问路径为相对路径。3、根据目录所在段落下标删除前后段落,进行文档段落拆分,将拆分的文件转换成html文件输出保存。1、添加POI对应的jar包,我基本上用到了这些,其他看个人情况自行添加。
原创
2023-08-03 14:05:48 ·
616 阅读 ·
0 评论