Python3,自动识别图片文字,这个库,我爱了。

1、引言

小鱼:小屌丝,你在干啥呢?
小屌丝:我女神给我的任务啊,把图片上的文字都给写下来。
小鱼:这图片上的文字,可不少啊,你都是手敲的??
小屌丝:可不,不然还有啥法子?
在这里插入图片描述
小鱼:我敬佩你是一条汉子。
小屌丝:鱼哥,难道你有什么好的法子?
小鱼:嗯,突然想到的, OCR 。
小屌丝:那你还不赶紧救救我,
小鱼:唉~ ~ 好吧…

图像识别,这里就要提到OCR了,
但是提到OCR,又不得不提到的两个库:

  • cnocr :识别图片的汉字;
  • Pytesseract:识别图片的英文

分别对图片的文字的中文和英文进行识别的。
话不多说,我们直接代码示例演示。

2、Cnocr

2.1 安装

老规矩,直接pip 安装

pip install cnocr

其它安装方式,直接看这两篇:

Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!
Python3:我低调的只用一行代码,就导入Python所有库!

提示一下,
cnocr下的torch 有161.8MB,
所以下载的话,最好在网速快或者国内镜像网站进行下载,否则就会下载失败。
在这里插入图片描述

2.2 代码示例

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
	识别图片中的汉字
'''
from cnocr import CnOcr

#图片名称
file_name = './data/cn_name.png'
ocr = CnOcr()
result = ocr.ocr(file_name)
print(f"Predicted Chars:{result}")

3、Pytesseract

3.1 安装

1、pytesseract
老规矩,直接pip 安装

pip install pytesseract

2、Tesseract
Windows版本,需要手动安装,下载地址如下:

3.1 代码示例

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
	识别图片中的英文
'''
import pytesseract
from PIL import Image

#图片名称
file_name = './data/en_name.png'
#打开图片
image = Image.open(file_name)

result = pytesseract.image_to_string(image, lang='eng')
print(f'识别结果:{result}')

4、总结

看到这里,今天的分享就到这里了。
关于识别图片中的文字,这里例举了OCR中的 cnocr 与pytesseract,
其实代码很简单,只是安装过程中需要一点点的耐心。

我是小鱼:

关注我,带你学习Python领域更多更专业的技能。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Carl_奕然

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值