图像识别
文章平均质量分 77
捡石子的小孩
这个作者很懒,什么都没留下…
展开
-
Tesseract学习(一)
最近在做一个有关图像识别的项目,在这个过程中研究过许多算法也尝试写过,但效果不怎么好。后来别人建议我用开源类库Tesseract。由于网上大部分都是C++实现的,官网又是全英文的,于是走过许多弯路。下面写下自己学习的体会。 官网上现在有最新安装版tesseract-ocr-3.02.exe,安装后就直接可以通过cmd调用。安装包中默认有英文语言包,要识别中文需要另外引入中文语言包。点此处原创 2014-01-05 21:19:01 · 8530 阅读 · 0 评论 -
Tesseract学习(二)
在上篇博客中介绍到如何在cmd中通过命令的方式调用tesseract,接下来我们讨论如何在C#程序中调用,此处我是通过WinForm进行的封装。 首先给出调用进程的代码: private void fnOCR(string v_strSourceImgPath, string v_strOutputPath) { using原创 2014-01-05 21:45:41 · 6275 阅读 · 2 评论 -
Tesseract学习(三)
前两篇博客讲的都是通过调用客户端程序的方式来识别图像,但一旦要识别的图片很多的话,识别速度将很不乐观,因为频繁的打开关闭进程、频繁的访问文件都会严重影响程序的时间效率。 接下来我将介绍通过调用API的方式。刚开始以为通过API的方式只能使用C++写,因为我看过的十几篇博客中都是C++实现的,于是郁闷了很久但后来发现原来有个网站提供C#版的dll,顿时喜极而泣啊有木有 虽然个原创 2014-01-05 22:40:19 · 10444 阅读 · 12 评论 -
Tesseract学习(四)
本博客将介绍如何在C#下调用Tesseract-OCR,只需添加dll即可方便的调用里面的API。dll文件可在此处下载,下载后添加到项目引用。与在C++下添加引用不同,此处无需再进行繁琐的配置,所以下面直接贴代码:using System;using System.Collections.Generic;using System.ComponentModel;using Sys原创 2014-01-05 23:39:30 · 14742 阅读 · 22 评论 -
Tesseract学习(五)
前面讲的都是对于标准字的识别,但对于验证码或者手写字体识别率就会非常低。为了让Tesseract识别自己的语言,可以通过训练语言库的方式来解决。下面通过一个识别手写字体的例子来了解Tesseract提供什么方式训练自己的语言库。 首先我们来看下未经过训练的Tesseract对接下来的这张图片的识别率。待识别图片:识别结果: 可以看出识别效果很不理想。下面训原创 2014-01-10 22:55:00 · 11071 阅读 · 1 评论