解析excel文件生成固定格式的TXT文件

 

在工作中,有时需要将excel格式的文件,转化成TXT格式,并且文件内容可能还需要修改。如下做简单介绍,将图一excel转化为图二使用“|”分割格式的TXT文件。

 

 

 

 

                                                                                   图一

                                                                                            图二

 

 
 
实现上述效果的代码如下:
package neusoft.settle.transferJPG;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.util.Date;

import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFDateUtil;
import org.apache.poi.hssf.usermodel.HSSFRow;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;

/*
 * 将excel解析为TXT文件
 * author:x-h
 */
public class ExcelReader {
	// 创建文件输入流
	private BufferedReader reader = null;
	// 文件类型
	private String filetype;
	// 文件二进制输入流
	private InputStream is = null;
	// 当前的Sheet
	private int currSheet;
	// 当前位置
	private int currPosition;
	// Sheet数量
	private int numOfSheets;
	// HSSFWorkbook
	HSSFWorkbook workbook = null;
	// 设置Cell之间以空格分割
	private static String EXCEL_LINE_DELIMITER = "|";
	// 设置最大列数
	private static int MAX_EXCEL_COLUMNS = 64;

	// 构造函数创建一个ExcelReader
	public ExcelReader(File inputfile) throws IOException, Exception {
		// 判断参数是否为空或没有意义
		if (inputfile == null) {
			throw new IOException("no input file specified");
		}
		// 取得文件名的后缀名赋值给filetype
		this.filetype = inputfile.getName().substring(inputfile.getName().lastIndexOf(".") + 1);
		// 设置开始行为1,可以选择从第几列开始:最小为0
		currPosition = 1;
		// 设置开始sheet页,当前位置为0
		currSheet = 0;
		// 创建文件输入流
		is = new FileInputStream(inputfile);
		// 判断文件格式
		if (filetype.equalsIgnoreCase("xls")) {
			// 如果是Excel文件则创建HSSFWorkbook读取
			workbook = new HSSFWorkbook(is);
			// 设置Sheet数
			numOfSheets = workbook.getNumberOfSheets();
		} else {
			throw new Exception("File Type Not Supported");
		}
	}

	// 函数readLine读取文件的一行
	public String readLine() throws IOException {
		// 如果是XLS文件则通过POI提供的API读取文件
		if (filetype.equalsIgnoreCase("xls")) {
			// 根据currSheet值获得当前的sheet
			HSSFSheet sheet = workbook.getSheetAt(currSheet);
			// 判断当前行是否到但前Sheet的结尾
			// System.out.println(sheet.getLastRowNum());
			if (currPosition > sheet.getLastRowNum()) {
				// 当前行位置清零
				currPosition = 0;
				// 判断是否还有Sheet
				if (currSheet != numOfSheets - 1) {
					currSheet++;
					// 得到下一张Sheet
					sheet = workbook.getSheetAt(currSheet);
				} else {
					return null;
				}
			}

			StringBuffer s = new StringBuffer();
			// 循环行数,将所有行拼成报文格式的字符串
			for (int i = currPosition; i <= sheet.getLastRowNum(); i++) {
				getLine(sheet, i);
				s.append(getLine(sheet, i));
				// 每行的后面追加换行
				s.append("\n");

			}
			// 读取当前行数据
			return s.toString();

		}
		return null;
	}

	// 函数getLine返回Sheet的一行数据

	@SuppressWarnings("deprecation")
	private String getLine(HSSFSheet sheet, int row) {

		// 根据行数取得Sheet的一行
		HSSFRow rowline = sheet.getRow(row);

		// 创建字符创缓冲区
		StringBuffer buffer = new StringBuffer();

		// 获取当前行的列数
		int filledColumns;
		try {
			filledColumns = rowline.getLastCellNum();
		} catch (NullPointerException e) {
			return "";
		}
		HSSFCell cell = null;
		// 循环遍历所有列,可以选择从第几列开始:最小为0
		// for (int i = 6; i < filledColumns; i++) {
		for (int i = 6; i < 22; i++) {
			// 取得当前Cell
			cell = rowline.getCell((short) i);
			String cellvalue = null;
			if (cell != null) {
				// 判断当前Cell的Type
				switch (cell.getCellType()) {
				// 如果当前Cell的Type为NUMERIC
				case HSSFCell.CELL_TYPE_NUMERIC: {
					// 判断当前的cell是否为Date
					if (HSSFDateUtil.isCellDateFormatted(cell)) {
						// 如果是Date类型则,取得该Cell的Date值
						Date date = cell.getDateCellValue();
						// 把Date转换成本地格式的字符串
						cellvalue = cell.getDateCellValue().toString();
					}
					// 如果是纯数字
					else {
						// 取得当前Cell的数值
						Integer num = new Integer((int) cell.getNumericCellValue());
						cellvalue = String.valueOf(num);
					}
					break;
				}
				// 如果当前Cell的Type为STRIN
				case HSSFCell.CELL_TYPE_STRING:
					// 取得当前的Cell字符串
					cellvalue = cell.getRichStringCellValue().toString().replaceAll("'", "''");
					break;
				// 默认的Cell值
				default:
					cellvalue = "....";
				}
			} else {
				cellvalue = "";
			}
			// 在每个字段之间插入分割符
			buffer.append(cellvalue).append(EXCEL_LINE_DELIMITER);
		}
		// 以字符串返回该行的数据
		return buffer.toString();
	}

	// close函数执行流的关闭操作
	public void close() {
		// 如果is不为空,则关闭InputSteam文件输入流
		if (is != null) {
			try {
				is.close();
			} catch (IOException e) {
				is = null;
			}
		}
		// 如果reader不为空则关闭BufferedReader文件输入流
		if (reader != null) {
			try {
				reader.close();
			} catch (IOException e) {
				reader = null;
			}
		}
	}

	//将字符串写入到TXT文件
	public void StringToTXT(String input) {

		FileWriter fw = null;
		File f = new File("d://Tesseract-OCR//output.txt");

		try {
			if (!f.exists()) {
				f.createNewFile();
			}
			fw = new FileWriter(f);
			BufferedWriter out = new BufferedWriter(fw);
			out.write(input, 0, input.length() - 1);
			out.close();
		} catch (IOException e) {
			e.printStackTrace();
		}
	}

	public static void main(String[] args) {
		// 带解析excel文件路径
		String path = "d://Tesseract-OCR//ic91.xls";
		try {
			// 实例化ExcelReader
			ExcelReader excelReader = new ExcelReader(new File(path));
			// 按行读取文件
			String valCode = excelReader.readLine();
			// 字符串写到TXT文件中
			excelReader.StringToTXT(valCode);
			//关闭流
			excelReader.close();
			System.out.println(valCode);
		} catch (IOException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

}


喜欢我的文章希望和我一起成长的宝宝们,可以搜索并添加公众号TryTestwonderful ,或者扫描下方二维码添加公众号

 

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TryTestwonderful

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值