寒假期间在bilibili中找到一个学python的视频,现将从中学到的几个工程搬运到本论坛中以供广大博友学习借鉴。原版视频是 Murtaza Hassan讲解的,讲的是英语而且没有字幕,博主的英语很烂,英语四级都是大四六月份才过的,所以看起来非常痛苦😫。所以海绵将视频中的内容在博客中复现,博友们不用观看视频,仅仅通过阅读本系列博客即可学到文本检测的内容。
0 废话不多说,先看一下效果图

经过处理后,可以明显地看出图片上的文字均被识别并显示在原文字上方。程序代码不长,不到100行就可以实现,可以说是非常简单啦。有些人可能要问了,为什么能使用这么短的代码实现对文字的识别,这就不得不介绍本文标题中的Tesseract了。Tesseract是一款可以识别100多种语言的开源软件,可以训练自己的文字识别模型、识别各国语言的文字结果输出为txt等格式,不但可以使用在windows、ios等系统,还可以在ubuntu系统中使用,说明树莓派等微型实时操作系统也可以借助该软件实现OCR文字识别。
以下是一篇在Ubuntu18.04安装Tesseract库的博客,需要的请跳转。
开源OCR识别库-Tesseract介绍 - 平凡的编程者 - 博客园 (cnblogs.com)
1 准备阶段
(1)windows系统安装Tesseract软件
Tesseract的安装不算难,我是参考下方的博客安装完成的,步骤很少一般不会出错。记住软件安装位置,我的安装位置是D:\\program file\\setup\\OCR。
Tesseract-OCR5.0软件安装和语言包安装(Windows系统)_桔子code 的博客-CSDN博客
在python环境里运行“import

本文介绍了如何利用Python的pytesseract库结合Tesseract OCR软件进行文字识别。通过实例展示了image_to_string、image_to_boxes和image_to_data三个关键API的使用,分别用于将图片转换为字符串、输出字符坐标和详细数据。Tesseract是一款强大的开源OCR软件,支持多种语言,并可在多种操作系统上运行。
最低0.47元/天 解锁文章
1120

被折叠的 条评论
为什么被折叠?



