java 读取rtf文件_JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例

这个博客展示了如何使用JAVA读取不同类型的文件内容,包括Word、Excel、PDF、TXT、RTF和HTML。通过Apache POI库读取Word和Excel,PDFBox库读取PDF,使用基本IO操作读取TXT,以及使用RTFEditorKit处理RTF文件。同时,文章提到了在使用WPS编辑相关文档时可能会遇到的错误。
摘要由CSDN通过智能技术生成

点击这里查看相关控件的下载地址和配置方法。

WORD

Java代码

packagetextReader;

importjava.io.*;

importorg.apache.poi.hwpf.extractor.WordExtractor;

publicclassWordReader {

publicWordReader(){

}

/**

* @param filePath 文件路径

* @return 读出的Word的内容

*/

publicString getTextFromWord(String filePath){

String result =null;

File file =newFile(filePath);

try{

FileInputStream fis =newFileInputStream(file);

WordExtractor wordExtractor =newWordExtractor(fis);

result = wordExtractor.getText();

}catch(FileNotFoundException e){

e.printStackTrace();

}catch(IOException e){

e.printStackTrace();

};

returnresult;

}

}

package textReader;

import java.io.*;

import org.apache.poi.hwpf.extractor.WordExtractor;

public class WordReader {

public WordReader(){

}

/**

* @param filePath 文件路径

* @return 读出的Word的内容

*/

public String getTextFromWord(String filePath){

String result = null;

File file = new File(filePath);

try{

FileInputStream fis = new FileInputStream(file);

WordExtractor wordExtractor = new WordExtractor(fis);

result = wordExtractor.getText();

}catch(FileNotFoundException e){

e.printStackTrace();

}catch(IOException e){

e.printStackTrace();

};

return result;

}

}

EXCEL

Java代码

packagetextReader;

importorg.apache.poi.hssf.usermodel.HSSFWorkbook;

importorg.apache.poi.hssf.usermodel.HSSFSheet;

importorg.apache.poi.hssf.usermodel.HSSFRow;

importorg.apache.poi.hssf.usermodel.HSSFCell;

importjava.io.FileInputStream;

importjava.io.FileNotFoundException;

importjava.io.IOException;

publicclassExcelReader {

@SuppressWarnings("deprecation")

/**

* @param filePath 文件路径

* @return 读出的Excel的内容

*/

publicString getTextFromExcel(String filePath) {

StringBuffer buff =newStringBuffer();

try{

//创建对Excel工作簿文件的引用

HSSFWorkbook wb =newHSSFWorkbook(newFileInputStream(filePath));

//创建对工作表的引用。

for(intnumSheets =0; numSheets 

if(null!= wb.getSheetAt(numSheets)) {

HSSFSheet aSheet = wb.getSheetAt(numSheets);//获得一个sheet

for(introwNumOfSheet =0; rowNumOfSheet <= aSheet.getLastRowNum(); rowNumOfSheet++) {

if(null!= aSheet.getRow(rowNumOfSheet)) {

HSSFRow aRow = aSheet.getRow(rowNumOfSheet);//获得一个行

for(intcellNumOfRow =0; cellNumOfRow <= aRow.getLastCellNum(); cellNumOfRow++) {

if(null!= aRow.getCell(cellNumOfRow)) {

HSSFCell aCell = aRow.getCell(cellNumOfRow);//获得列值

switch(aCell.getCellType()){

caseHSSFCell.CELL_TYPE_FORMULA:

break;

caseHSSFCell.CELL_TYPE_NUMERIC:

buff.append(aCell.getNumericCellValue()).append('\t');break;

caseHSSFCell.CELL_TYPE_STRING:

buff.append(aCell.getStringCellValue()).append('\t');break;

}

}

}

buff.app

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值