【word】word 获取所有文本

1. 需求                  

处理 word 文本中的内容 ,正则匹配搜索相关内容时使用


2. 测试 jar 包               

gradle 依赖

    compile group: 'org.apache.poi', name: 'poi', version: '3.13'//word excel 解析
    compile group: 'org.apache.poi', name: 'poi-ooxml', version: '3.13'//word excel 解析
    compile group: 'org.apache.poi', name: 'poi-scratchpad', version: '3.13'//word excel 解析

3.代码实例               


Util 类

  public static String getDocContent(String path) throws Exception {
        String docContent = "";
        File file = new File(path);
        FileInputStream in = new FileInputStream(file);
        if (".docx".equals(path.substring(path.lastIndexOf(".", path.length())))) {
            XWPFDocument document = new XWPFDocument(in);
            XWPFWordExtractor wordExtractor = new XWPFWordExtractor(document);
            docContent += wordExtractor.getText();
        } else if (".doc".equals(path.substring(path.lastIndexOf(".", path.length())))) {
            HWPFDocument document = new HWPFDocument(in);
            Range range = document.getRange();
            docContent += range.text();
        }else {
            throw new Exception("文件格式不正确");
        }
        return docContent;
    }

测试类:

package com.ycit.poi;

import com.ycit.utils.POIUtils;
import org.junit.Test;

/**
 * Created by xlch on 2017/1/11.
 */
public class DocContentTest {

    @Test
    public void docTest()throws Exception{
        String path = "D:\\about project\\perp-service\\5812-1.doc";
//        String path = "D:\\about project\\perp-service\\5812-1.docx";
        String content = POIUtils.getDocContent(path);
        System.out.println(content);
    }

}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值