tesseract
caiqi1123
caiqi1123
展开
-
Tesseract-OCR3.01语言库训练步骤
使用的是最新的3.01版本的。训练所需准备:1.下载并安装3.01版本的tesseract。事实上并不需要安装这步骤,我下载的是压缩包版,解压即可,这里我解压到E:\Tesseract-ocr目录。2.下载并安装jTessBoxEditor工具,这是一个Box file editors,用来编辑训练文件的,直接下载地址在这里。这个软件是用java写的,运行需要安装jre,好在这个东转载 2012-09-17 12:53:53 · 3767 阅读 · 1 评论 -
tesseract3.01的训练和使用
相关源码、资源下载:http://code.google.com/p/tesseract-ocr/downloads/list训练步骤:1、 Generate Training Images:生成tif图像文件(简单的几个汉字);如:ABC.Roman.exp0.tif([lang].[fontname].exp[num].tif)2、 Make Box Files:由上t转载 2012-09-19 09:17:43 · 1357 阅读 · 0 评论 -
tesseract-ocr识别中文扫描图片实例讲解
tesseract-ocr识别中文扫描图片实例讲解本文参考http://blog.csdn.net/zhoushuyan/archive/2010/10/18/5948289.aspx#1567946实现,在这里感谢该文章的作者。当我浏览http://code.google.com/p/tesseract-ocr并下载了几个文件下来之后顿时感到一头雾水,不知该如何下手。网上看到有人在lin转载 2012-09-19 09:19:01 · 1518 阅读 · 0 评论 -
Tesseract 3 语言数据的训练方法
需要用到的程序(1) Tesseract 3.00(2) Tesseract 3.00 Bugfix(3) CowBoxer 1.01(4) Universal Extractor 1.61 (非必需)使用 Universal Extractor 将 Tesseract 的安装包解开,再用 Bugfix 里的 tesseract.exe 覆盖原来的主程序转载 2012-09-19 09:20:15 · 1347 阅读 · 0 评论 -
OCR识别引擎tesseract使用方法
最近一直跟OCR打交道,学习了下google的OCR引擎TESSERACT,是个很好的识别工具。tesseract-3.0已支持版面分析,功能很强大。安装tesseract前可选择性地安装leptonica和libtiff。不过建议先安装这两个库。不安装tiff的话只能处理bmp文件。 这里只是说明怎么识别中文。依次安装好libtiff,leptonica和tesseract后,下载简转载 2012-09-19 09:21:05 · 3535 阅读 · 1 评论 -
tesseract3.0.1在vs2010的配置备忘录
1)在主页上下载了tesseract-3.01-win_vs.zip(工程);tesseract-3.01.tar.gz(源代码)之后;解压;(注意:选择解压到****\(E)。如:解压到tesseract-3.0.1\(E))。2)将目录tesseract-3.01中的所有文件夹拷贝到\tesseract-3.01-win_vs\tesseract-3.01中。3)对于tesseract原创 2012-09-21 09:51:35 · 2968 阅读 · 5 评论