Docx4j在linux下中文乱码,docx4j word转pdf中文出现乱码,贵阳Java培训

本文介绍了一个Java应用示例,展示如何使用Docx4j在Linux环境中处理Word文档(.docx)并避免中文乱码问题。通过设置字体映射和加载Arial Unicode MS字体,成功转换Word为PDF,同时解决了转换过程中的中文乱码。代码中包含了关键步骤,如字体配置和转换设置,以及性能统计。教程最后鼓励读者关注更多相关教程。
摘要由CSDN通过智能技术生成

public class App {

public static void main(String[] args) {

try {

long start = System.currentTimeMillis();

InputStream is = new FileInputStream(new File("D:\\test.doc"));

WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(is);

/* List sections = wordMLPackage.getDocumentModel().getSections();

for (int i = 0; i 

wordMLPackage.getDocumentModel().getSections().get(i).getPageDimensions().setHeaderExtent(3000);

}*/

Mapper fontMapper = new IdentityPlusMapper();

PhysicalFont font = PhysicalFonts.getPhysicalFonts().get("Arial Unicode MS");

fontMapper.getFontMappings().put("Algerian", font);

wordMLPackage.setFontMapper(fontMapper);

PdfSettings pdfSettings = new PdfSettings();

org.docx4j.convert.out.pdf.PdfConversion conversion =

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值