tesseract安装文字识别-基础训练

本文介绍了如何在macOS上安装Tesseract并进行基础的文字识别训练。通过下载训练素材,使用jTessBoxEditor进行字符矫正,创建字体文件,最终训练出能有效识别文字的库。在训练过程中,作者遇到并解决了运行脚本找不到命令的问题,通过Docker成功运行命令。
摘要由CSDN通过智能技术生成

效果对比

训练前:在这里插入图片描述
这里明显可以看出来真的很烂,识别的什么玩意儿
训练后:
在这里插入图片描述
完美的训练。

安装tesseract

macOS下安装:

  1. 首先安装tesseract,这个应该是基础程序吧
brew install tesseract

2.下载语言(字)库
字库下载,可以顺便把tesseract下载了,后面如果异常可能用到这里的文件。
3.训练工具jTessBoxEditor
在这里插入图片描述
下载地址:jTessBoxEditor

训练素材

在这里插入图片描述
在这里插入图片描述
素材来自其他博客。

识别文字

先来撸一把,看看效果。

tesseract 18295877-d1d7ad6d4394555c.png result -l chi_si
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值