docx4j操作word文档之替换模板数据

docx4j替换模板数据

docx4j

docx4j是一个开源(ASLv2)Java库,用于创建和操作Microsoft Open XML(Word docx,Powerpoint pptx和Excel xlsx)文件;它类似于Microsoft的OpenXML SDK,但适用于Java。docx4j使用JAXB来创建内存中的对象表示。

示例

1. word中创建占位符

如果我要替换word文档中的动态数据,只需把数据用${xxx}形式标注。
在这里插入图片描述
这里可能会存在一个问题:
将.docx文档压缩成.zip文档,再xml文件阅读器打开word/document.xml文件,可以看到有可能出现下图占位符被分隔的问题,这样的话,到时候不能被数据替换。
在这里插入图片描述
原因:网上有许多,有的说占位符格式不统一;有的说单词校验问题。
解决方法:我刚开始试了把占位符的格式统一,好像没什么用,然后只能在xml文件里一个一个的改,既累又麻烦!最后,把要写的占位符先写到记事本中,然后再复制到word中,这样就不会被分隔。

2.获取模板以及替换数据

import org.docx4j.model.datastorage.migration.VariablePrepare;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
import org.docx4j.openpackaging.parts.WordprocessingML.MainDocumentPart;

import java.beans.PropertyDescriptor;
import java.io.*;
import java.lang.reflect.Field;
import java.lang.reflect.Method;
import java.text.SimpleDateFormat;
import java.util.*;

public class Docx4jDemo1 {

    public static void main(String[] args) {
        Map<String, String> data = new HashMap<>();
        data.put("classname", "三年二班");
        data.put("total", "50");
        data.put("male", "30");
        data.put("female", "20");
        data.put("name", "小明");
        data.put("sex", "男");
        data.put("age", "10");
        data.put("phone", "13888888888");
        data.put("address", "中国");
        data.put("email", "xiaoming@163.com");
        try {
            replaceData(data);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    /**
     * 加载模板并替换数据
     *
     * @param data
     * @return
     * @throws Exception
     */
    public static void replaceData(Map<String, String> data) throws Exception {
        final String TEMPLATE_NAME = "D://1.docx";
        InputStream templateInputStream = new FileInputStream(TEMPLATE_NAME);
        //加载模板文件并创建WordprocessingMLPackage对象
        WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(templateInputStream);
        MainDocumentPart documentPart = wordMLPackage.getMainDocumentPart();
        VariablePrepare.prepare(wordMLPackage);
        documentPart.variableReplace(data);
        OutputStream os = new FileOutputStream(new File("D://test.docx"));
        ByteArrayOutputStream outputStream = new ByteArrayOutputStream();
        wordMLPackage.save(outputStream);
        outputStream.writeTo(os);
        os.close();
        outputStream.close();
        templateInputStream.close();
    }

    /**
     * 如果从数据库查出来的是不同对象集合,那么该方法直接把对象的属性和值直接存为Map
     * 比如示例中可以是两个对象,ClassInfo(className,total,male,female)、student(name,sex,...)
     * 前提是模板中的占位符一定要和对象的属性名一一对应
     * @param objlist
     * @return
     * @throws Exception
     */
    public HashMap<String, String> toMap(List<Object> objlist) throws Exception {
        HashMap<String, String> variables = new HashMap<>();
        String value = "";
        if (objlist == null && objlist.isEmpty()) {
            return null;
        } else {
            for (Object obj : objlist) {
                Field[] fields = null;
                fields = obj.getClass().getDeclaredFields();
                //删除字段数组里的serialVersionUID
                for (int i = 0; i < fields.length; i++) {
                    fields[i].setAccessible(true);
                    if (fields[i].getName().equals("serialVersionUID")) {
                        fields[i] = fields[fields.length - 1];
                        fields = Arrays.copyOf(fields, fields.length - 1);
                        break;
                    }
                }
                //遍历数组,获取属性名及属性值
                for (Field field : fields) {
                    field.setAccessible(true);
                    String fieldName = field.getName();
                    //如果属性类型是Date
                    if (field.getGenericType().toString().equals("class java.util.Date")) {
                        PropertyDescriptor pd = new PropertyDescriptor(fieldName, obj.getClass());
                        Method getMethod = pd.getReadMethod();
                        Date date = (Date) getMethod.invoke(obj);
                        value = (date == null) ? "" : new SimpleDateFormat("yyyy-MM-dd").format(date);
                    } else if (field.getGenericType().toString().equals("class java.lang.Integer")) {
                        //如果属性类型是Integer
                        PropertyDescriptor pd = new PropertyDescriptor(fieldName, obj.getClass());
                        Method getMethod = pd.getReadMethod();
                        Object object = getMethod.invoke(obj);
                        value = (object == null) ? String.valueOf(0) : object.toString();
                       
                    } else if (field.getGenericType().toString().equals("class java.lang.Double")) {
                        //如果属性类型是Double
                        PropertyDescriptor pd = new PropertyDescriptor(fieldName, obj.getClass());
                        Method getMethod = pd.getReadMethod();
                        Object object = getMethod.invoke(obj);
                        value = (object == null) ? String.valueOf(0.0) : object.toString();
                       
                    } else {
                        PropertyDescriptor pd = new PropertyDescriptor(fieldName, obj.getClass());
                        Method getMethod = pd.getReadMethod();
                        Object object = getMethod.invoke(obj);
                        value = (object == null) ? "  " : object.toString();
                        
                    }
                    variables.put(fieldName, value);
                }
            }
            return variables;
        }
    }
}

结果

在这里插入图片描述
这些都是一些简单的功能,复杂的后续会有,因为时间关系,只写了这点。这些功能的实现都是前辈们智慧的结晶以及自己的一些探索。有什么不足之处望大家批评指正!感谢大家!

### 使用Docx4j生成和导出Word文档 #### 添加Maven依赖 为了在Java项目中使用`docx4j`库,需向项目的`pom.xml`文件添加如下依赖: ```xml <dependency> <groupId>org.docx4j</groupId> <artifactId>docx4j</artifactId> <version>8.2.3</version> </dependency> ``` 此版本号可能随时间更新,请查阅官方仓库获取最新版本信息[^1]。 #### 创建简单的Word文档实例 下面展示一段创建简单Word文档并将文本写入其中的例子: ```java import org.docx4j.jaxb.Context; import org.docx4j.openpackaging.packages.WordprocessingMLPackage; import org.docx4j.wml.ObjectFactory; import org.docx4j.wml.P; import org.docx4j.wml.R; import org.docx4j.wml.Text; public class CreateSimpleDocument { public static void main(String[] args) throws Exception { WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage(); ObjectFactory factory = Context.getWmlObjectFactory(); P paragraph = factory.createP(); // 创建一个新的段落 R run = factory.createR(); // 创建运行对象用于容纳文字 Text text = factory.createText(); text.setValue("Hello Docx4j!"); run.getContent().add(text); paragraph.getContent().add(run); wordMLPackage.getMainDocumentPart().getContent().add(paragraph); String outputfilepath = "output.docx"; wordMLPackage.save(new java.io.File(outputfilepath)); System.out.println("Saved to:" + outputfilepath); } } ``` 这段程序会生成一个名为`output.docx`的新文件,在该文件内含有字符串“Hello Docx4j!”作为唯一的内容。 #### 替换模板中的占位符 对于更复杂的场景,比如基于已有模板替换指定位置的文字,则可以通过加载现有`.dotx`或`.docx`模板文件,并利用正则表达式或其他方式定位到要被替代的部分来进行处理。例如,如果模板中有形如`{name}`这样的标记,就可以编写逻辑去查找并替换成实际的名字值。 #### 处理表格与图片等内容 当涉及到更加丰富的元素如表格、图表或是嵌入图像时,`docx4j`同样提供了相应的API接口允许开发者对其进行编程控制。不过这类操作通常较为复杂,建议参考官方文档深入了解具体细节[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值