Node解析Doc两种格式，全代码

木偶☜

于 2022-06-20 10:55:11 发布

阅读量10w+

点赞数

分类专栏： node 文章标签： javascript 前端 node.js

本文链接：https://blog.csdn.net/qq_45096273/article/details/125368123

版权

node 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

这段代码演示了如何利用Node.js的Mammoth库来获取带格式的文本和纯文本内容。首先，通过fs模块读取上传目录中的文件名，并返回。接着，通过convertToHtml方法将Word文档转换为HTML格式，或者使用extractRawText方法提取原始文本内容。这两个API分别用于获取格式化和非格式化的文档数据。

摘要由CSDN通过智能技术生成

一.获取带格式文本

const express = require('express')
const fs = require('fs')
const path = require('path')

var mammoth = require("mammoth");
const router = express.Router()
// 获取文件名
router.get('/see/doctext', (req, res) => {
        fs.readdir('./static/upload', (err, data) => {
            if (err) {
                console.log("错误" + err);
            } else {
                var arr = []
                for (let i = 0; i < data.length; i++) {
                    arr.push({
                        dirname: './static/upload//',
                        filename: data[i]
                    })
                }
                res.send({
                    code: 200,
                    result: arr
                })
            }
        })
})
// 对应文件数据的解析
router.get('/doc/jx/text', (req, res) => {
    // ConvertToHtml
    mammoth.convertToHtml({ path: req.query.dirname + req.query.filename })
        .then(function (result) {
            let result1 = {
                code: 200,
                results: result
            }
            res.send(result1)
        }).done();
})
module.exports = router;

二.获取纯文本

const express = require('express')
const fs = require('fs')
const path = require('path')

var mammoth = require("mammoth");
const router = express.Router()
// 获取文件名
router.get('/see/doctext', (req, res) => {
        fs.readdir('./static/upload', (err, data) => {
            if (err) {
                console.log("错误" + err);
            } else {
                var arr = []
                for (let i = 0; i < data.length; i++) {
                    arr.push({
                        dirname: './static/upload//',
                        filename: data[i]
                    })
                }
                res.send({
                    code: 200,
                    result: arr
                })
            }
        })
})
// 对应文件数据的解析
router.get('/doc/jx/text', (req, res) => {
    // extractRawText
    mammoth.extractRawText({ path: req.query.dirname + req.query.filename })
        .then(function (result) {
            let result1 = {
                code: 200,
                results: result
            }
            res.send(result1)
        }).done();
})
module.exports = router;