【js】Mammoth.js的使用:将.docx 文件转换成HTML

  • docx文档预览
  • FileReader 对象
  • Blob对象

只能转换.docx文档,转换过程中复杂样式被忽略。(居中、首行缩进等)
在这里插入图片描述

API

  • mammoth.convertToHtml(input, options) :把源文档转换为 HTML 文档
  • mammoth.convertToMarkdown(input, options) :把源文档转换为 Markdown 文档。
  • mammoth.extractRawText(input) :提取文档的原始文本。这将忽略文档中的所有格式。每个段落后跟两个换行符。

Demo HTML文件

<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>test</title>
</head>

<body>
    <div class="container">
        <input id="document" type="file" />
        <div class="row" style="width: 100%;">
            <div class="span8">
                <div id="output" class="well"></div>
            </div>
        </div>
    </div>

    <script src="https://cdn.bootcss.com/mammoth/1.4.8/mammoth.browser.js"></script>
    <script type="text/javascript">
        document.getElementById("document")
            .addEventListener("change", readFileInputEventAsArrayBuffer, false);

        function displayResult(result) {
            let html = result.value;
            let newHTML = html.replace(//g, '')
            .replace('<h1>', '<h1 style="text-align: center;">')
            .replace(/<table>/g, '<table style="border-collapse: collapse;">')
            .replace(/<tr>/g, '<tr style="height: 30px;">')
            .replace(/<td>/g, '<td style="border: 1px solid pink;">')
            .replace(/<p>/g, '<p style="text-indent: 2em;">');
            document.getElementById("output").innerHTML = newHTML;
        }

        function readFileInputEventAsArrayBuffer(event) {
            var file = event.target.files[0];
            var reader = new FileReader();

            reader.onload = function (loadEvent) {
                var arrayBuffer = loadEvent.target.result;//arrayBuffer     
                mammoth.convertToHtml({ arrayBuffer: arrayBuffer })
                    .then(displayResult)
                    .done();
            };

            reader.readAsArrayBuffer(file);
        }
    </script>
</body>

</html>

项目中的应用:
后端返回二进制。

var xhr = new XMLHttpRequest();
xhr.open(
    "GET",
    `${url}/web/showWordDownload?companyId=${that.companyId}`
);
xhr.responseType = "arraybuffer";
xhr.onload = function (e) {
    let content = xhr.response;
    let blob = new Blob([content], { type: "application/pdf" });
    
    let reader = new FileReader();
	reader.readAsArrayBuffer(blob);
    reader.onload = function (loadEvent) {
    	var arrayBuffer = xhr.response; //arrayBuffer

    	mammoth
        	.convertToHtml({ arrayBuffer: arrayBuffer })
        	.then(displayResult)
        	.done();
    };
    
    function displayResult(result) {
        document.getElementById("output").innerHTML =result.value;
    }
};
 xhr.send();

FileReader对象

FileReader对象,可以读取计算机本地文件 或数据缓冲 进行处理。
创建对象 : let reader = new FileReader();

方法描述
readAsArrayBuffer(file)异步按字节读取文件内容,结果用ArrayBuffer对象表示。简单理解为存放了一段二进制数据的内存空间
readAsBinaryString(file)异步按字节读取文件内容,结果为文件的二进制串
readAsDataURL(file)结果用data:url的字符串形式表示【base64编码后输出】
事件描述
onload读取成功完成时调用

使用:

let input = document.getElementById('input');
input.onchange = function(){
	let file = this.files[0];
	let reader = new FileReader();
	reader.readAsArrayBuffer(file);
	reader.onload = function(){
		//读取完成
		console.log(this.result);// this.result 为结果
	}
}

应用场景:
1.在线预览本地文件。(图片 readerAsDataURL)
2、二进制数据上传。
input【type=“file”】
readAsArrayBuffer => xhr 将读取的结果发给后端。

  • 3
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值