只需要几行代码就可以轻松实现OCR图片转文字

OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。

下载安装包

tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/

进入下载页面。

可以看到有各种.exe文件的下载列表,根据自己需求下载(其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本,例如可以选择下载tesseract-ocr-setup-4.0.0-alpha.20170804。)图片

安装

下载后傻瓜式安装即可。

图片

图片

这里选择语言包,简体中文(但勾选语言包较多时下载较慢,本人建议直接安装,安装后根据需要再去下载语言包。)

图片

选择合适的安装路径完成安装。

图片

环境变量配置

设置环境变量,进入环境变量中,找path,新建路径。如图:

图片

测试

查看是否安装成功,打开cmd,输入tesseract -v回车,若显示版本号即为安装成功。如图:

图片

测试文件

我在网上随便找了两首古诗竟是文字识别测试,如下

图片

python库

所需第三方库安装方式

# pytesseract安装:
pip install pytesseract

# PIL安装:
pip install pillow

测试结果

短短七行代码即可实现图片转文字,结果如下:

图片

问题汇总

Tesseract在安装过程中出现Download error Status of equ: Send Request Error. Click OK to continue!!!已解决

图片

出错的原因应该是,墙的问题,,请求失败,尝试管理员身份还是失败,,,既然download失败,那么就换种方式下载

Github上下载自己需要的语言包

https://tesseract-ocr.github.io/tessdoc/Data-Files

获取到语言包后直接解压,并且再次配置环境变量如下:

点击我的电脑–>属性–>高级设置—>环境变量---->path下面的—>新建—>变量名:TESSDATA_PREFIX---->变量值:前面的加上\tessdata

图片

将下载好的语言包解压,打开tessdata文件夹

图片

然后将其复制到tessdata中。图片

最后,重启一下电脑!!!!

然后win+R 快捷打开cmd,输入tesseract --list-langs 就可,就可以看到所有的语言类型了。

图片

推荐文章

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

在这里插入图片描述

目前开通了技术交流群,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

  • 方式①、发送如下图片至微信,长按识别,后台回复:加群;
  • 方式②、添加微信号:dkl88191,备注:来自CSDN
  • 方式③、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

长按关注

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是一个简单的Java代码示例,演示了如何使用Tesseract OCR库和iText库实现OCR识别图片换成双层PDF: ```java import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import javax.imageio.ImageIO; import com.itextpdf.awt.DefaultFontMapper; import com.itextpdf.text.Document; import com.itextpdf.text.PageSize; import com.itextpdf.text.Rectangle; import com.itextpdf.text.pdf.PdfContentByte; import com.itextpdf.text.pdf.PdfLayer; import com.itextpdf.text.pdf.PdfLayerMembership; import com.itextpdf.text.pdf.PdfName; import com.itextpdf.text.pdf.PdfWriter; import net.sourceforge.tess4j.Tesseract; import net.sourceforge.tess4j.TesseractException; import net.sourceforge.tess4j.util.ImageHelper; public class OCRToPDF { public static void main(String[] args) { // 读取图片文件 File imageFile = new File("input.png"); // 定义输出PDF文件 File pdfFile = new File("output.pdf"); // 创建Tesseract OCR对象 Tesseract tesseract = new Tesseract(); // 设置OCR语言为英语 tesseract.setLanguage("eng"); try { // 读取图片换为灰度图像 BufferedImage image = ImageIO.read(imageFile); BufferedImage grayImage = ImageHelper.convertImageToGrayscale(image); // 进行OCR识别 String result = tesseract.doOCR(grayImage); // 创建PDF文档 Document document = new Document(PageSize.A4); // 创建PDF写入器 PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(pdfFile)); // 打开文档 document.open(); // 创建图层 PdfContentByte canvas = writer.getDirectContent(); PdfLayer imageLayer = new PdfLayer("Image Layer", writer); PdfLayer textLayer = new PdfLayer("Text Layer", writer); // 将图像添加到图像层 PdfLayerMembership imageMembership = new PdfLayerMembership(writer); imageMembership.addMember(imageLayer); canvas.beginLayer(imageMembership); canvas.drawImage(Image.getInstance(imageFile.getAbsolutePath()), 0, 0, PageSize.A4.getWidth(), PageSize.A4.getHeight()); canvas.endLayer(); // 将OCR识别文本添加到文本层 PdfLayerMembership textMembership = new PdfLayerMembership(writer); textMembership.addMember(textLayer); canvas.beginLayer(textMembership); canvas.beginText(); canvas.setFontAndSize(DefaultFontMapper.getAModelFont("Arial", false), 12); canvas.showTextAligned(result, 100, 100, PdfContentByte.ALIGN_LEFT); canvas.endText(); canvas.endLayer(); // 关闭文档 document.close(); } catch (IOException e) { e.printStackTrace(); } catch (TesseractException e) { e.printStackTrace(); } catch (Exception e) { e.printStackTrace(); } } } ``` 请注意,此示例代码仅提供了基本的实现方法。在实际应用中,您需要根据具体需求进行更细粒度的调整和优化。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值