一、具体实现思路
1、docx转html
使用docx4j获取dcox文档的xml文件内容,然后使用dom4j进行解析,对于不同的内容,新建pojo类,将解析的内容封装进去,然后统一转换为html;
由于pojo类过多,所以这里就不展示一个个展示,最后会提供下载地址,
其中word中某些样式提供自定义的属性,如编号、项目符号、标题等
2、html转docx
根据之前自定义的属性,使用jsoup将html内容进行解析,然后生成docx文档;
其中具体代码,大家可下载 https://download.csdn.net/download/qq_38635531/11965679
二、资源说明
Word文档在线编辑功能说明
一、支持的文件类型:docx类型文档(即word2007)
二、Word转为html格式后的html页面结构
除表格外、所有的内容都需要在p标签内(包括图片),如图:
三、支持转换的内容
1.标题,如图