anaconda中通过pytesseract识别中文字符

最新推荐文章于 2023-02-27 01:41:20 发布

JIOPu

最新推荐文章于 2023-02-27 01:41:20 发布

阅读量970

点赞数 3

分类专栏： OCR中文字符识别文章标签： opencv python

本文链接：https://blog.csdn.net/m0_46498587/article/details/109400786

版权

OCR中文字符识别专栏收录该内容

1 篇文章 0 订阅

订阅专栏

使用pytesseract识别中文字符

环境的安装可以参考：https://editor.csdn.net/md/?articleId=109255325

首先，需要下载相应的数据集，可以自行搜索官网，下载chi_sim.traineddata

链接：

百度网盘：
链接：https://pan.baidu.com/s/1Z79jcrMwumlDHEXRyk82eg
提取码：pxwh

将这个数据集放入安装的Tesseract-OCR\tessdata中

在这里插入图片描述
我使用的是anaconda安装。
然后就是几行代码实现中文字符的识别：

# 导入模块和包
from PIL import Image
import pytesseract

# 打开需要识别的图片
img = Image.open('1.jpg')
# 识别图片，指定lang = ‘chi_sim’即可识别中文
content = pytesseract.image_to_string(img, lang = 'chi_sim')
# 输出打印一下
print(content)

这里附上这个所有识别字体的数据包

链接：https://pan.baidu.com/s/1FdAwdIVUGhBk0jA_V4i62g
提取码：lfel

JIOPu

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
anaconda中通过pytesseract识别中文字符

使用pytesseract识别中文字符环境的安装可以参考：https://editor.csdn.net/md/?articleId=109255325首先，需要下载相应的数据集，可以自行搜索官网，下载chi_sim.traineddata链接：百度网盘：链接：https://pan.baidu.com/s/1Z79jcrMwumlDHEXRyk82eg提取码：pxwh将这个数据集放入安装的Tesseract-OCR\tessdata中我使用的是anaconda安装。然后就是几行代码实现
复制链接

扫一扫

专栏目录