1. 首先清楚docx文件实质上是一个压缩包,把后缀名改成zip保存后解压即可看到docx底层代码
2. 在解压缩文件中有一个document.xml他是docx文件的内容主体,docx文件中的内容都在此文件中
目录结构如图所示:
详细路径自己可解压查看。
3. 本人因工作需求,需要在每份docx文件的首页插入一个表格,表格是动态的
经历:a . 通过docx4j实现成功过,但是对于内容比较复杂,格式比较多的docx文件,插入后格式会乱;
b. 通过poi的方式实现过,结果一样格式还会乱;
总结:因为这些都是第三方工具,它底层到底怎么操作的说实话真不好搞明白,那我就直接搞明白docx底层怎么实现的就行了,稳妥。
4. 此处我就以在首页插入分页为例讲解下怎么实现。
4.1. 先打开document.xml文件发现它是很有规律的(找规律很重要),它的大致结构就是<w:body>&