经过本人的多次实践探索,已上线至我的网站: www.hit56.com ,可以在上面直接体验图片OCR功能
一、百度的PaddlePaddle
https://github.com/PaddlePaddle/PaddleOCR
二、一个开源软件
https://github.com/DayBreak-u/chineseocr_lite
三、 谷歌的OCR实践方案
https://github.com/tesseract-ocr/tesseract在这里插入代码片
1. 安装软件包
pip install opencv-python
pip install pytesseract
2. 安装语言包
# CentOS 系统
yum install -y tesseract
yum install -y tesseract-langpack-chi_sim
yum install -y tesseract-langpack-chi_tra
# Ubuntu 系统
apt-get install tesseract
apt-get install tesseract-ocr-chi-sim
apt-get install tesseract-ocr-chi-tra
3. 运行代码
import cv2
import sys
import pytesseract
if __name__ == '__main__':
if len(sys.argv) < 2:
print('Usage: python ocr_demo.py image.jpg')
sys.exit(1)
# 使用命令行参数
imPath = sys.argv[1]
# -l 识别中文
# --oem 使用LSTM作为OCR引擎,可选值为0、1、2、3;
# 0 Legacy engine only.
# 1 Neural nets LSTM engine only.
# 2 Legacy + LSTM engines.
# 3 Default, based on what is available.
# --psm 设置Page Segmentation模式为自动
config = ('-l chi_sim --oem 1 --psm 3')
im = cv2.imread(imPath, cv2.IMREAD_COLOR)
# 进行识别,本质上是调用tesseract命令行工具
text = pytesseract.image_to_string(im, config=config)
# 打印结果
print(text)
三、facebook的抠图模型
https://github.com/facebookresearch/segment-anything