如何制作属于自己的图片OCR功能

文章介绍了OCR技术的实践,包括百度的PaddlePaddleOCR库、一个开源的ChineseOCR_lite项目、谷歌的tesseractOCR工具及其在Python中的应用,以及Facebook的抠图模型Segment-Anything。提供了详细的安装步骤和代码示例,特别针对中文识别进行了配置说明。
摘要由CSDN通过智能技术生成


经过本人的多次实践探索,已上线至我的网站: www.hit56.com ,可以在上面直接体验图片OCR功能
在这里插入图片描述

一、百度的PaddlePaddle

https://github.com/PaddlePaddle/PaddleOCR

二、一个开源软件

https://github.com/DayBreak-u/chineseocr_lite

三、 谷歌的OCR实践方案

https://github.com/tesseract-ocr/tesseract在这里插入代码片

1. 安装软件包

pip install opencv-python
pip install pytesseract

2. 安装语言包

# CentOS 系统
yum install -y tesseract 
yum install -y tesseract-langpack-chi_sim
yum install -y tesseract-langpack-chi_tra
# Ubuntu 系统
apt-get install tesseract
apt-get install tesseract-ocr-chi-sim
apt-get install tesseract-ocr-chi-tra

3. 运行代码

import cv2
import sys
import pytesseract
if __name__ == '__main__':
  if len(sys.argv) < 2:
    print('Usage: python ocr_demo.py image.jpg')
    sys.exit(1)

  # 使用命令行参数
  imPath = sys.argv[1]

  # -l 识别中文
  # --oem 使用LSTM作为OCR引擎,可选值为0、1、2、3;
  #  0    Legacy engine only.
  #  1    Neural nets LSTM engine only.
  #  2    Legacy + LSTM engines.
  #  3    Default, based on what is available.
  # --psm 设置Page Segmentation模式为自动
  config = ('-l chi_sim --oem 1 --psm 3')

  im = cv2.imread(imPath, cv2.IMREAD_COLOR)

  # 进行识别,本质上是调用tesseract命令行工具
  text = pytesseract.image_to_string(im, config=config)

  # 打印结果
  print(text)

三、facebook的抠图模型

https://github.com/facebookresearch/segment-anything

四、参考文献

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值