简单数字识别 python+tesseract-ocr
- 需求
实现一个简单数字图片识别功能,并在PC端跑起来 - 场景
相机拍照数据图片,程序识别出图片上简单数据并返回 - 工具
pycharm - 环境
python3.7 + tesseract-ocr 5.0 - 依赖
matplotlib3.1.2
numpy1.17.4
opencv-python4.1.2.30
Pillow6.2.1
pyparsing2.4.5
pytesseract0.3.1
python-dateutil2.8.1
PyInstaller3.5 - 识别原理
使用python 调用pytesseract 通过tesseract-ocr实现简单数字图片的识别。
opencv-python:图像处理的库
pytesseract:从图像中提取数字的库 - 步骤
1.加载图片
rawImage = cv2.imread(image)
2.灰度
gray = cv2.cvtColor(rawImage, cv2.COLOR_BGR2GRAY)
在使用tesseract-ocr做图片识别时需要白底黑字,如果是黑底白字的话需要做像素转换,代码如下
rawImage = cv2.imread(image)
height, width, deep = rawImag