OCR
SH-ZZB
这个作者很懒,什么都没留下…
展开
-
最新Tesseract-OCR源码编译1——leptonica编译
上次写了Tesseract-OCR 3.02命令行程序的简单使用,同时官网上给出了3.02版本基于VS2008平台的编译工程。但对于最新源码只是说了在VS2015(3.05)和VS2013(3.04)的编译,还是英文的,且网上关于最新源码的编译不是很多,所以这里我就说一下其最新源码的编译。因为Tesseract依赖于leptonica,所以这里先讲一下最新的leptonica编译。原创 2016-06-26 15:47:19 · 7733 阅读 · 5 评论 -
Tesseract-OCR 3.02命令行程序的使用
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。最近因为需要看了看OCR的相关知识,这里我看的是谷歌的Tesseract-OCR检测引擎。Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为3.原创 2016-06-21 20:43:45 · 6883 阅读 · 0 评论