在工作中,有时需要将excel格式的文件,转化成TXT格式,并且文件内容可能还需要修改。如下做简单介绍,将图一excel转化为图二使用“|”分割格式的TXT文件。
图一
图二
实现上述效果的代码如下:
package neusoft.settle.transferJPG;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.util.Date;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFDateUtil;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
/*
* 将excel解析为TXT文件
* author:x-h
*/
public class ExcelReader {
// 创建文件输入流
private BufferedReader reader = null;
// 文件类型
private String filetype;
// 文件二进制输入流
private InputStream is = null;
// 当前的Sheet
private int currSheet;
// 当前位置
private int currPosition;
// Sheet数量
private int numOfSheets;
// HSSFWorkbook
HSSFWorkbook workbook = null;
// 设置Cell之间以空格分割
private static String EXCEL_LINE_DELIMITER = "|";
// 设置最大列数
private static int MAX_EXCEL_COLUMNS = 64;
// 构造函数创建一个ExcelReader
public ExcelReader(File inputfile) throws IOException, Exception {
// 判断参数是否为空或没有意义
if (inputfile == null) {
throw new IOException("no input file specified");
}
// 取得文件名的后缀名赋值给filetype
this.filetype = inputfile.getName().substring(inputfile.getName().lastIndexOf(".") + 1);
// 设置开始行为1,可以选择从第几列开始:最小为0
currPosition = 1;
// 设置开始sheet页,当前位置为0
currSheet = 0;
// 创建文件输入流
is = new FileInputStream(inputfile);
// 判断文件格式
if (filetype.equalsIgnoreCase("xls")) {
// 如果是Excel文件则创建HSSFWorkbook读取
workbook = new HSSFWorkbook(is);
// 设置Sheet数
numOfSheets = workbook.getNumberOfSheets();
} else {
throw new Exception("File Type Not Supported");
}
}
// 函数readLine读取文件的一行
public String readLine() throws IOException {
// 如果是XLS文件则通过POI提供的API读取文件
if (filetype.equalsIgnoreCase("xls")) {
// 根据currSheet值获得当前的sheet
HSSFSheet sheet = workbook.getSheetAt(currSheet);
// 判断当前行是否到但前Sheet的结尾
// System.out.println(sheet.getLastRowNum());
if (currPosition > sheet.getLastRowNum()) {
// 当前行位置清零
currPosition = 0;
// 判断是否还有Sheet
if (currSheet != numOfSheets - 1) {
currSheet++;
// 得到下一张Sheet
sheet = workbook.getSheetAt(currSheet);
} else {
return null;
}
}
StringBuffer s = new StringBuffer();
// 循环行数,将所有行拼成报文格式的字符串
for (int i = currPosition; i <= sheet.getLastRowNum(); i++) {
getLine(sheet, i);
s.append(getLine(sheet, i));
// 每行的后面追加换行
s.append("\n");
}
// 读取当前行数据
return s.toString();
}
return null;
}
// 函数getLine返回Sheet的一行数据
@SuppressWarnings("deprecation")
private String getLine(HSSFSheet sheet, int row) {
// 根据行数取得Sheet的一行
HSSFRow rowline = sheet.getRow(row);
// 创建字符创缓冲区
StringBuffer buffer = new StringBuffer();
// 获取当前行的列数
int filledColumns;
try {
filledColumns = rowline.getLastCellNum();
} catch (NullPointerException e) {
return "";
}
HSSFCell cell = null;
// 循环遍历所有列,可以选择从第几列开始:最小为0
// for (int i = 6; i < filledColumns; i++) {
for (int i = 6; i < 22; i++) {
// 取得当前Cell
cell = rowline.getCell((short) i);
String cellvalue = null;
if (cell != null) {
// 判断当前Cell的Type
switch (cell.getCellType()) {
// 如果当前Cell的Type为NUMERIC
case HSSFCell.CELL_TYPE_NUMERIC: {
// 判断当前的cell是否为Date
if (HSSFDateUtil.isCellDateFormatted(cell)) {
// 如果是Date类型则,取得该Cell的Date值
Date date = cell.getDateCellValue();
// 把Date转换成本地格式的字符串
cellvalue = cell.getDateCellValue().toString();
}
// 如果是纯数字
else {
// 取得当前Cell的数值
Integer num = new Integer((int) cell.getNumericCellValue());
cellvalue = String.valueOf(num);
}
break;
}
// 如果当前Cell的Type为STRIN
case HSSFCell.CELL_TYPE_STRING:
// 取得当前的Cell字符串
cellvalue = cell.getRichStringCellValue().toString().replaceAll("'", "''");
break;
// 默认的Cell值
default:
cellvalue = "....";
}
} else {
cellvalue = "";
}
// 在每个字段之间插入分割符
buffer.append(cellvalue).append(EXCEL_LINE_DELIMITER);
}
// 以字符串返回该行的数据
return buffer.toString();
}
// close函数执行流的关闭操作
public void close() {
// 如果is不为空,则关闭InputSteam文件输入流
if (is != null) {
try {
is.close();
} catch (IOException e) {
is = null;
}
}
// 如果reader不为空则关闭BufferedReader文件输入流
if (reader != null) {
try {
reader.close();
} catch (IOException e) {
reader = null;
}
}
}
//将字符串写入到TXT文件
public void StringToTXT(String input) {
FileWriter fw = null;
File f = new File("d://Tesseract-OCR//output.txt");
try {
if (!f.exists()) {
f.createNewFile();
}
fw = new FileWriter(f);
BufferedWriter out = new BufferedWriter(fw);
out.write(input, 0, input.length() - 1);
out.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
// 带解析excel文件路径
String path = "d://Tesseract-OCR//ic91.xls";
try {
// 实例化ExcelReader
ExcelReader excelReader = new ExcelReader(new File(path));
// 按行读取文件
String valCode = excelReader.readLine();
// 字符串写到TXT文件中
excelReader.StringToTXT(valCode);
//关闭流
excelReader.close();
System.out.println(valCode);
} catch (IOException e) {
e.printStackTrace();
} catch (Exception e) {
e.printStackTrace();
}
}
}
喜欢我的文章希望和我一起成长的宝宝们,可以搜索并添加公众号TryTestwonderful ,或者扫描下方二维码添加公众号