java 操作word表格_Java对word表格的处理

这篇博客介绍了如何使用Java的Apache POI库来操作Word文档中的表格,包括读取表格内容。示例代码展示了遍历并打印Word文档中所有表格和单元格内容的方法。同时提到了POI在处理复杂数据和图片时的局限性,以及由于兼容性问题,Jacob库在Linux上的不适用。
摘要由CSDN通过智能技术生成

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import org.apache.poi.hwpf.HWPFDocument;

import org.apache.poi.hwpf.usermodel.Paragraph;

import org.apache.poi.hwpf.usermodel.Range;

import org.apache.poi.hwpf.usermodel.Table;

import org.apache.poi.hwpf.usermodel.TableCell;

import org.apache.poi.hwpf.usermodel.TableIterator;

import org.apache.poi.hwpf.usermodel.TableRow;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStream;

import org.apache.poi.POIXMLDocument;

import org.apache.poi.POIXMLTextExtractor;

import org.apache.poi.hwpf.extractor.WordExtractor;

import org.apache.poi.openxml4j.opc.OPCPackage;

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;

import org.apache.poi.poifs.filesystem.POIFSFileSystem;

public class ExportDocImpl

{

public void testWord(){

try{

FileInputStream in = new FileInputStream("D:\\sinye.doc");//载入文档

POIFSFileSystem pfs = new POIFSFileSystem(in);

HWPFDocument hwpf = new HWPFDocument(pfs);

Range range = hwpf.getRange();//得到文档的读取范围

TableIterator it = new TableIterator(range);

//迭代文档中的表格

while (it.hasNext()) {

Table tb = (Table) it.next();

//迭代行,默认从0开始

for (int i = 0; i < tb.numRows(); i++) {

TableRow tr = tb.getRow(i);

//迭代列,默认从0开始

for (int j = 0; j < tr.numCells(); j++) {

TableCell td = tr.getCell(j);//取得单元格

//取得单元格的内容

for(int k=0;k

Paragraph para =td.getParagraph(k);

String s = para.text();

System.out.println(s);

} //end for

} //end for

} //end for

} //end while

}catch(Exception e){

e.printStackTrace();

}

}//end method

public void testWord1(){

try {

//word 2003: 图片不会被读取

InputStream is = new FileInputStream(new File("D:\\sinye.doc"));

WordExtractor ex = new WordExtractor(is);

String text2003 = ex.getText();

System.out.println(text2003);

//word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后

OPCPackage opcPackage = POIXMLDocument.openPackage("D:\\sinye.doc");

POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);

String text2007 = extractor.getText();

System.out.println(text2007);

} catch (Exception e) {

e.printStackTrace();

}

}

}

当然POI对不算太复杂的数据处理是很方便,但涉及到了表格,图片就比较麻烦了。

2 jacob对表格的处理

但是因为微软的恶心,好像目前不支持在Linux上。所以这里不多说了。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值