aspose将word文档转为html内容

网站开发过程中,有时候需要将word内容展示在网页,可以通过aspose将doc文件直接转为pdf进行预览,但是有时候可能需要就在网页的某部分信息中显示内容,而不需要在线预览,这时候可以考虑将word内容简单转换为html内容来显示。

  1. 引入aspose相关jar包
  2. 将word内容转为HTML字符串
/**
	 * word转html文本
	 * @param doc 需要转换的doc文件对象
	 * @return
	 */
	public String parseWord2Html(Document doc){
		HtmlSaveOptions saveOptions = new HtmlSaveOptions();
		saveOptions.setExportHeadersFootersMode(ExportHeadersFootersMode.NONE); // HtmlSaveOptions的其他设置信息请参考相关API
		ByteArrayOutputStream htmlStream = new ByteArrayOutputStream();
		String htmlText = "";
		try {
			doc.save(htmlStream, saveOptions);
			htmlText = new String(htmlStream.toByteArray(),"UTF-8");
			htmlStream.close();
		} catch (Exception e) {
			LOG.error("word文件转换失败,详细错误信息:{}",e.getMessage());
		}
		return htmlText;
	}

转换的效果如下,左边是word内容,右边是转换后的内容:
在这里插入图片描述
当然,效果并不会特别好,但是一些简单的格式会转换成功,差不多够用了,比如标题居中、加粗、回车换行缩进等;复杂一点的格式就可能不会转换成功了,测试发现序号之类的没有转换成功,可能和我option配置的有关系,没有仔细研究。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值