基于tesseract的多线程OCR服务器的JAVA实现

本文介绍了一个使用JAVA实现的多线程OCR服务器,该服务器利用tesseract OCR引擎,能同时为多个android客户端提供图片OCR服务。项目涉及到JAVA图形处理、图像裁剪、二值化、去噪、CMD命令调用tesseract、线程池和互斥锁、以及网络编程中的socket技术。
摘要由CSDN通过智能技术生成

本文探讨基于tesseract的多线程OCR服务器的JAVA实现,可同时对多个android手机客户端提供图片OCR服务 

project源码下载 http://download.csdn.net/user/yangliuy   

最近接手一个项目,项目的背景是要开发一个CS架构的发票真伪识别系统,客户端为android手机,采集发票图像传到服务器做OCR识别,识别出来的发票号码和发票密码发送到国税局官网发票真伪查询页面,然后将真伪信息返回给手机用户。为了开发一个多线程OCR服务器,我研究了JAVA图像处理及OCR技术。JAVA的强大的图形处理相关库如java.awt.image等为采集图像的裁剪、放缩、二值化、去噪等提供了良好的基础,而OCR主要采用了Goolge tesseract开源OCR引擎,tesseract安装在本地后可以用cmd命令行调用,而JAVA支持cmd命令的调用。此外还用到了JAVA线程池、互斥锁等多线程编程技术及socket等网络编程技术。源码如下

多线程Server端 Server.java

package com.serverMain;
import java.net.ServerSocket;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.io.IOException;

/**
 * @author yangliuis@pku.edu.cn
 *
 */

public class Server extends Thread{
	private int port ;
	private ServerSocket server;
	private ExecutorService threadPool;//线程池
	
	public Server(int port) {
		super();
		this.port = port;
	}
	
	public void startServer ()throws IOException{
		server = new ServerSocket(port);
		threadPool = Executors.newCachedThreadPool();
		System.out.println("欢迎使用Helios系统,服务器启动");
		this.start();
	}
	
	public void run(){
		while(true){ 
			try {
				ServerRun task = new ServerRun(server.accept());
				threadPool.execute(task);
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
		}
	}
	/**
	 * @param args
	 * @throws IOException 
	 */
	public static void main(String[] args) throws IOException {
		// TODO Auto-generated method stub
		Server server = new Server(8089);
		server.startServer();
	}
}

Server端任务ServerRun.java

package com.serverMain;
import java.net.Socket;
import java.net.URL;
import java.net.URLConnection;
import java.io.BufferedReader;
import java.io.DataInputStream;
import java.io.BufferedOutputStream;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

import com.imageHandle.OperateImage;
import com.imageHandle.SoundBinImage;

/**
 * @author yangliuis@pku.edu.cn
 *
 */

public class ServerRun extends Thread implements Runnable{
	private static Integer invoicePicNum = 0;//发票图片序号
	//private static Integer captchasPicNum = 0;//验证码图片序号
	private Socket socket;
	private final String  invoiceDir = "F://Helios//data//invoice_image//";
	//private final String  captchasDir = "F://Helios//data//captchas_image//";
		
	public ServerRun(Socket socket){
		this.socket = socket;
	}
	
	public void run(){
		String invoicePicFilename = invoiceDir+"invoice_image_";
		invoicePicFilename += invoicePicNum+".jpg";		
		try {
			DataInputStream dis = new DataInputStream(socket.getInputStream());
			BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(invoicePicFilename));
			byte buffer[] = new byte[1024];
			int eof = 0;
			while((eof = dis.read(buffer, 0, 1024)) != -1) {
				bos.write(buffer, 0 ,e
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值