opencv+ocr
小任同学Alex
这个作者很懒,什么都没留下…
展开
-
paddleocr的中文检测总结
paddleocr的中文检测最近在做ocr检测,项目要求是中文、英文、数字和一些符号检测一开始用的是tesseract,对英文检测、数字检测和一些标点符号检测十分准确。但是因为项目中出现了中文、和一些残缺、粘连的以英文(二值化以后出现的情况,而且类似于手写体,不是标准字体),这个时候无论重新训练tesseract还是在原有基础上继续训练,总是无法达到满意的效果(ps:tesseract官方有训练好的中文模型,要自己找)试了很多种方式,包括opencv4.5.1开始支持文本检测模型高级API和文本识别模原创 2022-04-07 15:12:24 · 4614 阅读 · 0 评论 -
tesseract其实是有模式的
tesseract其实是有模式的仅限PSM_OSD_,//<仅限方向和脚本检测。PSM_AUTO_OSD,//<带方向和///<脚本检测。(OSD)仅PSM_AUTO_,//<自动页面分割,但无OSD或OCR。PSM_AUTO,//<全自动页面分割,但无OSD。PSM_SINGLE_COLUMN,//<假设一列文本大小可变。PSM_SINGLE_BLOCK_VERT_TEXT,//<假设一个垂直的统一块///<对齐文本。PSM_SINGLE_原创 2022-01-06 14:41:07 · 595 阅读 · 0 评论 -
最近在做ocr文字识别,记录下安装tesseract训练工具过程
最近在做ocr文字识别,记录下安装tesseract训练工具过程调用tesseract的API无需安装(也可以安装exe,设置环境变量),只需在vs中配置好(类似于opencv一样)而别人或官方训练好的模型在自己的项目上效果不佳时,需要训练模型。这里记录下训练需要安装的三个工具。1.tesseract:有博主建议不要下载带dev,alpha,beta等,不稳定,可能是测试版本。这里大家注意下。我安装的是:tesseract-ocr-setup-4.0.0dev-20161129.exejava的JD原创 2021-11-26 16:00:37 · 882 阅读 · 0 评论