目的:
Ubuntu 系统,给定一张图,识别图中的文字,以 “文字位置(4个2维坐标,可确定一个四边形)+文字内容 ”的形式返回输出。
效果展示:
下图中左图是原图,将ocr 检测到的文字区域框起来了;右图是按照原图大小生成的黑底图片,将ocr检测到的文字区域框起来,并将文字区域内识别的文字写进框内。
项目代码:
https://github.com/JianTang2000/OCR_certification
在github的 py_env_build.sh 和 requirements.txt 中有环境搭建的指令,可以按照操作;