node 读取 word docx 文档 (只能读取内容)

对于docx文件,您可以使用mammoth,它将从.docx文件中提取文本。

var mammoth = require("mammoth");

mammoth.extractRawText({path: "./routes/aaa.docx"})
    .then(function(result){
    var text = result.value; // The raw text 
    console.log(text);
    var messages = result.messages;
    console.log(result);
}).done();

读取pdf文件 可以将word转换成pdf文件:

var pdfText = require('pdf-text')
var pathToPdf = __dirname + "/info.pdf"
var fs = require('fs')
var buffer = fs.readFileSync(pathToPdf)

pdfText(buffer, function(err, chunks) {
 console.log(chunks)
})

mammoth 文档 : https://www.npmjs.com/package/mammoth

文章参考于 : https://stackoverflow.com/questions/9038231/can-i-read-pdf-or-word-docs-with-node-js

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值