基于OCR识别引擎的识别表格文字并将结果以Excel电子表格的形式原样导出的Android客户端代码

最新推荐文章于 2024-07-03 10:00:04 发布

江户川米兰

最新推荐文章于 2024-07-03 10:00:04 发布

阅读量8.7k

点赞数 1

分类专栏： Android开发文章标签： ocr Android 表格识别

本文链接：https://blog.csdn.net/webber888/article/details/80775448

版权

本文介绍了一款Android应用，该应用利用OCR技术识别表格图像，并将识别的文字以原始格式导出到Excel文件。过程包括图像预处理、表格线提取、单元格识别及内容写入Excel。

摘要由CSDN通过智能技术生成

基于OCR识别引擎的识别表格文字并将结果以Excel电子表格的形式原样导出的Android客户端代码

界面截图

实现思路

对表格图片进行灰度化和二值化处理
对图像进行倾斜矫正
进行表格线提取
进行表格线矫正
单元格提取
根据返回的每个单元格的像素位置对原图像进行剪裁
对剪裁得到的内容逐个进行Ocr识别
将识别的内容根据返回的位置数据写入Excel表格

其中的1~5步考虑到效率问题，使用C++代码编写，并编译成了so文件在代码中进行调用。

相关代码说明

public class TrimCell {
	private int LeftTopRow;	  //单元格左上角的纵坐标像素位置
	private int LeftTopColumn;	//单元格左上角的横坐标像素位置
	private int RightBottomRow;  //单元格右下角的纵坐标像素位置
	private int RightBottomColumn;	//单元格右下角的横坐标像素位置

	private int StartRow;	//在原表格的开始行
	private int EndRow