前言
本文是在python中,利用opencv处理图片,利用tesseractOCR来识别图片中的文本并进行替换的一种实现方法。
环境配置
系统:windows
平台:visual studio code
语言:python
库:pyqt5、opencv、tesseractOCR
代码介绍
本文程序功能实现,主要依赖于tesseractOCR这个库,它能够识别图片的文字并返回。当然,其识别是有准确度的,并非百分之百识别。
tesseract安装
需要先在官网下载安装程序:
tesseract下载地址:https://github.com/UB-Mannheim/tesseract/wiki/
然后在python中安装pytesseract:
pip install pytesseract
安装完成后,在程序里导入:
import pytesseract
tesseract使用
tesseract的输入参数通常是一张图片,可以是opencv处理后的图片数据: