![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习笔记
sosoben
半路出家的程序猿
展开
-
tesseract-ocr 学习笔记
由于OCR技术本身属于一个比较复杂比较新颖的技术,比较多软件公司都把它作为知识产权的一部分,网络上比较难找到开发教材。因此,采用一些现有的OCR识别模块将 有助于减少开发时间,增加研发效率。 对比了一些商业模块与开源模块,觉得其中tesseract-ocr开源模块比较贴合这次项目的要求(当前项目对文字数量少,只需要找出两机种不同,相对来说精确度要求低)。 tessera原创 2013-10-25 08:46:01 · 10838 阅读 · 10 评论 -
tesseract-ocr 3.02 信心值 字符坐标 学习笔记
在使用字符识别的过程中,需要辨别一些字符本身是否残缺或与标准字符是否有形变又或者想知道其在截图上面的坐标是什么,这样就需要用到tesseract-ocr 输出的HTML文件的功能了.命令行为tesseract -l eng outtext hocr其中hocr 参数是本身自带的一个配置文件,里面包含内容 tessedit_create_hocr 1,表示输出Htmlde 意思翻译 2013-10-31 12:47:58 · 6680 阅读 · 0 评论