基于VS2010+Opencv+Tesseract-3.02.02 快速实现字符识别

Tesseract的OCR作为一款字符识别的引擎,它最先是由惠普实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。后来,HP不久便决定放弃OCR业务,Tesseract也从此尘封。数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生。在2005年,Tesseract由美国内华达州信息技术研究所获得,并委托Google对其进行改进、优化工作。

Tesseract目前已作为开源项目发布在Google Project,它与Leptonica图片处理库结合,可以读取各种格式的图像并将它们转化成超过60种语言的文本,我们还可以不断训练自己的库,使图像转换文本的能力不断增强。如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

下载地址为http://code.google.com/p/tesseract-ocr/。

基于VS2010+Opencv+Tesseract-3.02.02 快速实现字符识别:

对于编译这块此文不做描述,如下是已经编译好的Tesseract-3.02.02库。

https://download.csdn.net/download/luxgang/12325162

移植步骤:

1. 拷贝库文件和头文件到工程中:

    将下载后的文件放入工程中:

二. VS工程中配置头文件和库文件:

项目->属性->VC++目录:

三、连接器指定静态库:

项目->属性-> 链接器-> 输入->附加依赖库

 

debug 添加leptonica 和 tesseract 目录中的 debug lib:

libtesseract302d.lib
giflib416-static-mtdll-debug.lib
libjpeg8c-static-mtdll-debug.lib
liblept168d.lib
liblept168-static-mtdll-debug.lib
libpng143-static-mtdll-debug.lib
libtiff394-static-mtdll-debug.lib
zlib125-static-mtdll-debug.lib

Relese 版本的话,添加也是跟上面一样配置,只是依赖库文件名不一样,不带d 或者debug 的lib 文件名。

四、工程代码中添加使用:

添加头文件:

#include "allheaders.h"
#include "baseapi.h"
#include "strngs.h"

添加实现代码:

 // 使用 tesseract 进行数字识别
    const char* lang = "eng";//eng
    string numText;
    tesseract::TessBaseAPI *tess = new tesseract::TessBaseAPI;        // 新建 tesseract 基类
    tess->Init(NULL,lang, tesseract::OEM_DEFAULT);        // 初始化
    tess->SetPageSegMode(tesseract::PSM_AUTO);    // 设置识别模式
    tess->SetImage(pixImage);
    numText = string(tess->GetUTF8Text());

详细代码请查看:


// test_ocrDlg.cpp : 实现文件
//

#include "stdafx.h"
#include "test_ocr.h"
#include "test_ocrDlg.h"
#include "afxdialogex.h"

#include "allheaders.h"
#include "baseapi.h"
#include "strngs.h"

#include <opencv2\opencv.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <iostream>
using namespace cv;
using namespace std;

/
#ifdef _DEBUG
#define new DEBUG_NEW
#endif


// 用于应用程序“关于”菜单项的 CAboutDlg 对话框

class CAboutDlg : public CDialogEx
{
public:
	CAboutDlg();

// 对话框数据
	enum { IDD = IDD_ABOUTBOX };

	protected:
	virtual void DoDataExchange(CDataExchange* pDX);    // DDX/DDV 支持

// 实现
protected:
	DECLARE_MESSAGE_MAP()
};

CAboutDlg::CAboutDlg() : CDialogEx(CAboutDlg::IDD)
{
}

void CAboutDlg::DoDataExchange(CDataExchange* pDX)
{
	CDialogEx::DoDataExchange(pDX);
}

BEGIN_MESSAGE_MAP(CAboutDlg, CDialogEx)
END_MESSAGE_MAP()


// Ctest_ocrDlg 对话框




Ctest_ocrDlg::Ctest_ocrDlg(CWnd* pParent /*=NULL*/)
	: CDialogEx(Ctest_ocrDlg::IDD, pParent)
{
	m_hIcon = AfxGetApp()->LoadIcon(IDR_MAINFRAME);
}

void Ctest_ocrDlg::DoDataExchange(CDataExchange* pDX)
{
	CDialogEx::DoDataExchange(pDX);
	DDX_Control(pDX, IDC_EDIT2, mcedit);
}

BEGIN_MESSAGE_MAP(Ctest_ocrDlg, CDialogEx)
	ON_WM_SYSCOMMAND()
	ON_WM_PAINT()
	ON_WM_QUERYDRAGICON()
	ON_BN_CLICKED(IDC_BUTTON1, &Ctest_ocrDlg::OnBnClickedButton1)
	ON_BN_CLICKED(IDC_BUTTON2, &Ctest_ocrDlg::OnBnClickedButton2)
END_MESSAGE_MAP()


// Ctest_ocrDlg 消息处理程序

BOOL Ctest_ocrDlg::OnInitDialog()
{
	CDialogEx::OnInitDialog();

	// 将“关于...”菜单项添加到系统菜单中。

	// IDM_ABOUTBOX 必须在系统命令范围内。
	ASSERT((IDM_ABOUTBOX & 0xFFF0) == IDM_ABOUTBOX);
	ASSERT(IDM_ABOUTBOX < 0xF000);

	CMenu* pSysMenu = GetSystemMenu(FALSE);
	if (pSysMenu != NULL)
	{
		BOOL bNameValid;
		CString strAboutMenu;
		bNameValid = strAboutMenu.LoadString(IDS_ABOUTBOX);
		ASSERT(bNameValid);
		if (!strAboutMenu.IsEmpty())
		{
			pSysMenu->AppendMenu(MF_SEPARATOR);
			pSysMenu->AppendMenu(MF_STRING, IDM_ABOUTBOX, strAboutMenu);
		}
	}

	// 设置此对话框的图标。当应用程序主窗口不是对话框时,框架将自动
	//  执行此操作
	SetIcon(m_hIcon, TRUE);			// 设置大图标
	SetIcon(m_hIcon, FALSE);		// 设置小图标

	// TODO: 在此添加额外的初始化代码

	return TRUE;  // 除非将焦点设置到控件,否则返回 TRUE
}

void Ctest_ocrDlg::OnSysCommand(UINT nID, LPARAM lParam)
{
	if ((nID & 0xFFF0) == IDM_ABOUTBOX)
	{
		CAboutDlg dlgAbout;
		dlgAbout.DoModal();
	}
	else
	{
		CDialogEx::OnSysCommand(nID, lParam);
	}
}

// 如果向对话框添加最小化按钮,则需要下面的代码
//  来绘制该图标。对于使用文档/视图模型的 MFC 应用程序,
//  这将由框架自动完成。

void Ctest_ocrDlg::OnPaint()
{
	if (IsIconic())
	{
		CPaintDC dc(this); // 用于绘制的设备上下文

		SendMessage(WM_ICONERASEBKGND, reinterpret_cast<WPARAM>(dc.GetSafeHdc()), 0);

		// 使图标在工作区矩形中居中
		int cxIcon = GetSystemMetrics(SM_CXICON);
		int cyIcon = GetSystemMetrics(SM_CYICON);
		CRect rect;
		GetClientRect(&rect);
		int x = (rect.Width() - cxIcon + 1) / 2;
		int y = (rect.Height() - cyIcon + 1) / 2;

		// 绘制图标
		dc.DrawIcon(x, y, m_hIcon);
	}
	else
	{
		CDialogEx::OnPaint();
	}
}

//当用户拖动最小化窗口时系统调用此函数取得光标
//显示。
HCURSOR Ctest_ocrDlg::OnQueryDragIcon()
{
	return static_cast<HCURSOR>(m_hIcon);
}



void Ctest_ocrDlg::OnBnClickedButton1() // 加载图片
{
	// TODO: 在此添加控件通知处理程序代码
	CImage myImage;
	CFileDialog fileDlg(TRUE, NULL, NULL, OFN_ALLOWMULTISELECT, _T("Picture Files \
																   (*.bmp *.jpg *png *.jpeg)|*bmp;;*jpg;;*png;;*jpeg||"), AfxGetMainWnd());


	if (fileDlg.DoModal() == IDOK)
	{
		POSITION mPos = fileDlg.GetStartPosition();
		if (mPos != NULL)
		{
			pathName = (LPCTSTR)fileDlg.GetPathName();
			if (!myImage.IsNull())//判断图象是否为空,如果不为空则先释放掉  
				myImage.Destroy();


			CEdit* cfolder;
			cfolder = (CEdit*) GetDlgItem(IDC_EDIT1);
			cfolder->SetWindowText(pathName); // 加载路径名显示到编辑框中

			myImage.Load(pathName); // 加载到 CImage
		}
	}
	CRect rect;
	CWnd *pWnd = GetDlgItem(IDC_STATIC);
	CDC *pDC = pWnd->GetDC();
	//第1个控件  
	pWnd->GetClientRect(&rect); //取得客户区尺寸  
	pDC->SetStretchBltMode(STRETCH_HALFTONE); //保持图片不失真  
	myImage.Draw(pDC->m_hDC, rect); //已控件尺寸大小来绘图  
	ReleaseDC(pDC);
	myImage.Destroy();
	//粘贴、复制到:打开button,可以选择文件路径打开位图显示在picture control里。
}


PIX* cvtMat2PIX(Mat imgGray)
{
	int cols = imgGray.cols;
	int rows = imgGray.rows;

	PIX *pixS = pixCreate(cols, rows, 8);

	for (int i = 0; i < rows; i++)
		for (int j = 0; j < cols; j++)
			pixSetPixel(pixS, j, i, (l_uint32)imgGray.at<uchar>(i, j));
	return pixS;
}


wchar_t * Utf_8ToUnicode(char* szU8)
{
	//UTF8 to Unicode
	//由于中文直接复制过来会成乱码,编译器有时会报错,故采用16进制形式
	//预转换,得到所需空间的大小
	int wcsLen = ::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), NULL, 0);

	//分配空间要给'\0'留个空间,MultiByteToWideChar不会给'\0'空间
	wchar_t* wszString = new wchar_t[wcsLen + 1];

	//转换
	::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), wszString, wcsLen);

	//最后加上'\0'
	wszString[wcsLen] = '\0';

	return wszString;

}

//将宽字节wchar_t*转化为单字节char* 

char* UnicodeToAnsi( const wchar_t* szStr ) 
{ 
	int nLen = WideCharToMultiByte( CP_ACP, 0, szStr, -1, NULL, 0, NULL, NULL ); 
	if (nLen == 0) 	{ 
		return NULL; 
	} 

	char* pResult = new char[nLen]; 
	WideCharToMultiByte( CP_ACP, 0, szStr, -1, pResult, nLen, NULL, NULL ); 

	return pResult; 
} 

void Ctest_ocrDlg::OnBnClickedButton2() // 识别
{
	// TODO: 在此添加控件通知处理程序代码
	if (pathName.IsEmpty())
	{
		MessageBox(TEXT("路径名非法!"), TEXT("路径"));
		return;
	}

	string filename = CT2A(pathName.GetString());
#if 1

	Mat srcimage = imread(filename);//filename
	if (!srcimage.data)
	{
		MessageBox(TEXT("图像数据为空!"), TEXT("imread"));
		return;
	}
	

	Mat grayimg;
	cvtColor(srcimage, grayimg, CV_BGR2GRAY);
	imshow("grayimg", grayimg);

	GaussianBlur(grayimg, grayimg, Size(5,5), 2, 2);

// 	imshow("Gaussianimg2", grayimg);
	Mat binImage;
	threshold(grayimg, binImage, 100,255,THRESH_BINARY_INV);//THRESH_BINARY_INV|THRESH_OTSU
 /*   adaptiveThreshold(~grayimg, binImage, 255, ADAPTIVE_THRESH_MEAN_C, THRESH_BINARY_INV, 15, -2);*/
 	Mat kernel = getStructuringElement(MORPH_RECT, Size(3,3), Point(-1, -1));
	// erode(binImage, binImage, kernel, Point(-1,-1), 1, 0);
 	morphologyEx(binImage, binImage, MORPH_OPEN, kernel, Point(-1, -1), 1, 0);

	imshow("binImage", binImage);
	//imwrite("F:/bin.tif", binImage);
#endif
	

#if 0


	const char *image_path = filename.c_str();
	// 使用 tesseract 进行数字识别
	
	tesseract::TessBaseAPI  api;
	api.Init(NULL,"eng",tesseract::OEM_DEFAULT);//chi_sim
	api.SetPageSegMode(tesseract::PSM_AUTO);
   

// 	FILE* fin = fopen(image_path, "rb");
// 	if (fin == NULL) {
// 		/*printf("Cannot open input file: %s\n", image_path);*/
// 		MessageBox(TEXT("Cannot open input file."), TEXT("fopen:"));
// 		exit(2);
// 	}
// 	fclose(fin);
// 
	PIX   *pixs;
	if ((pixs = pixRead(image_path)) == NULL) {
		MessageBox(TEXT("Unsupported image type."), TEXT("pixRead:"));
		exit(3);
	}
	pixDestroy(&pixs);

	STRING text_out;
	if (!api.ProcessPages(image_path, NULL, 0, &text_out)) {
		MessageBox(TEXT("Error during processing."), TEXT("ProcessPages:"));
	}

	string ocr_result = text_out.string();
	CString CS_rel(ocr_result.c_str());
	MessageBox(CS_rel, TEXT("识别结果为:"));


// 	//显示中文
// 	string ocr_result = text_out.string();
// 	wchar_t* tempchar = Utf_8ToUnicode((char*)ocr_result.c_str());
// 	char* resulttemp = UnicodeToAnsi(tempchar);
// 	CString CS_rel(resulttemp);
// 	MessageBox(CS_rel, TEXT("识别结果为:"));
#else
	

    PIX *pixImage = cvtMat2PIX(binImage);                // 将图片由 Mat 转换成 Pix 格式

    // 使用 tesseract 进行数字识别
    const char* lang = "eng";//eng
    string numText;
    tesseract::TessBaseAPI *tess = new tesseract::TessBaseAPI;        // 新建 tesseract 基类
    tess->Init(NULL,lang, tesseract::OEM_DEFAULT);        // 初始化
    tess->SetPageSegMode(tesseract::PSM_AUTO);    // 设置识别模式
    tess->SetImage(pixImage);
    numText = string(tess->GetUTF8Text());

	/*CString CS_rel(numText.c_str());*/
	// MessageBox(CS_rel, TEXT("识别结果为:"));
	

// 	显示
		wchar_t* tempchar = Utf_8ToUnicode((char*)numText.c_str());
		char* resulttemp = UnicodeToAnsi(tempchar);
		CString CS_rel(resulttemp);
		// MessageBox(CS_rel, TEXT("识别结果为:"));
       mcedit.SetWindowText(CS_rel);
#endif	
}



工程代码可在如下链接进行下载:

https://download.csdn.net/download/luxgang/12325248

添加语言包:

debug 版本中添加 tessdata 目录,下面放入语言包文件

同理,如果relese 版本对应也放入此目录和文件。

如果不放在此目录,就必须安装 tesseract window 版本,然后设置环境变量。

但是一般我们直接将语言包放在工程目录下,方便执行,所以最后采用第一种。

 

如有不懂可私信联系或下方留言。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值