WORD文档转换成HTML

背景

最近接到一个需求,将word文档,转换成网页中能直接使用的帮助文档。网上有很多的工具可以将WORD(.docx)文档转成HTML文件,最简单的方式就是文件另存为 .html 的文件。

直接另存为存在以下缺陷:

  1. 冗余信息过多,部分需要手动处理;
  2. 不能进修拓展操作(例如:重新配置样式主题;不能进行导航配置);
  3. 图片资源文件的额外处理

解决思路

有很多开源的工具可以处理word文档,支持各种语言,本文使用 Node.js(身为前端当然的啦)来解决。
为了增加前端展示时的灵活性,基本思路就是:
.docx => HTML => JSON => React/Vue

  1. 先将word 文档转化成 HTML/XML 格式;
  2. 再将HTML/XML 转化成 需要JSON 格式;
  3. 依据JSON 再使用 React/Vue等进行展示。

具体方案

word 文档(.docx)转化成 HTML/XML 格式;

基础环境依赖 node.js + mammoth.js@1.4.16
mammoth.js的基本用法参考官方文档,这里主要提几个注意事项,官方快速使用方法如下:

var mammoth = require("mammoth");

mammoth.convertToHtml({
   path: "path/to/document.docx"})
    .then(function(result){
   
        var html = result.value; // The generated HTML
        var messages = result.messa
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值