Java版Word开发工具Aspose.Words功能解析:将Word文档(DOC / DOCX)转换为HTML

Microsoft Word文件格式DOC / DOCX很著名,因为文字处理器支持多种功能来组织和解释信息。同样,HTML文件格式有助于在Web应用程序中显示信息。

在本文中,我们将学习使用Java将Word文件(DOC / DOCX)转换为HTML。aspose.words最新下载(技术交楼群 761297826)icon-default.png?t=M7J4https://www.evget.com/product/4116/download下载最新版试用。

  • 使用Java将Word(DOC / DOCX)转换为HTML
  • 使用Java将DOCX转换为HTML5
  • 使用Java将受密码保护的Word文件转换为HTML
  • 使用Java将Word转换为MHTML

①使用Java将Word(DOC / DOCX)转换为HTML

可以按照以下步骤将Word转换为HTML:

  • 加载带有DOC或DOCX扩展名的源Word文件
  • 将文件另存为输出HTML

下面的代码示例显示了如何使用Java将DOCX转换为HTML:

// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

输入DOCX文件预览

输出HTML文件预览

②使用Java将DOCX转换为HTML5

HTML5是HTML的最新版本。我们注意到在Aspose.Words API中对支持HTML5的重复请求。因此,支持DOCX到HTML的转换,可以通过以下步骤转换文件:

  • 加载输入的DOCX文件
  • 设置SaveFormat时设置HtmlSaveOptions
  • 设置HtmlVersion.HTML_5的枚举值
  • 保存输出文件

下面的代码段显示了如何在Java中将DOCX转换为HTML5:

// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);        
doc.save(dataDir + "TestFile.html", opts);

③使用Java将受密码保护的Word文件转换为HTML

DOC或DOCX文件有时受密码保护或使用密码加密。也可以将此类文件转换为HTML。但是,在加载Word文件时需要密码。可以按照以下步骤将DOCX转换为HTML:

  • 初始化LoadOptions类的对象
  • 设定密码
  • 加载加密的DOCX文件
  • 将DOCX转换为HTML

同样,以下代码示例显示了如何使用Java将受密码保护的DOCX文件转换为HTML:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx" , options); 
//Save the document in HTML format.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

④使用Java将Word转换为MHTML

MHTML文件是包含嵌入式内容和媒体的单个文件。您可以按照以下步骤将Word文件(DOC / DOCX)转换为MHTML:

  • 加载输入的DOCX文件
  • 使用SaveFormat.MHTML保存输出MHTML文件

下面的代码段基于此步骤。因此,它显示了如何使用Java将DOCX转换为MHML:

// Load word document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值