[原创] Aspose Words Word 转 TXT

2 篇文章 0 订阅
2 篇文章 0 订阅

用 aspose words 把 Docx/Doc 转换为 TXT, 并保留表格格式

Java

import com.aspose.words.Document;
import com.aspose.words.TxtSaveOptions;

import java.io.File;
import java.nio.file.Paths;
//import java.nio.file.Path;
import java.io.FileOutputStream;

public class Pdf2Txt {
    public static void main(String[] args)throws Exception {
        String input_path = args[0];
        String output_dir = args[1];
        txt(input_path, output_dir);

    private static void txt(String input_path, String output_dir)throws Exception {
        TxtSaveOptions txtSaveOptions = new TxtSaveOptions();
        String input_name = Paths.get(input_path).getFileName().toString();
        // System.out.println("inputfilename: " + input_name);
        String output_path = Paths.get(output_dir).resolve(input_name).toString() + ".txt";
        System.out.println("output: " + output_path);

        txtSaveOptions.setParagraphBreak("\n"); // 设置换行符
        //txtSaveOptions.setExportGeneratorName(false);
        txtSaveOptions.setPreserveTableLayout(true); //保留表格风格
        txtSaveOptions.setPrettyFormat(true); // 格式化
        txtSaveOptions.setUseHighQualityRendering(true); //高质量渲染

        Document doc = new Document(input_path);
        doc.save(output_path, txtSaveOptions);
    }
}

Python

  • 安装
pip install aspose-words
  • 代码
import sys
import os.path
import aspose.words as aw

op = aw.saving.TxtSaveOptions()
op.export_generator_name = False
op.paragraph_break = '\n'
op.preserve_table_layout = True
op.pretty_format = True
op.use_high_quality_rendering = True

doc = aw.Document(sys.argv[0])
filename = os.path.basename(sys.argv[0])
doc.save(os.path.join(sys.argv[1], filename) + '.txt', op)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值