Mac/Linux下Tesseract-OCR 的安装与使用

本文介绍了在Mac和Linux环境下安装和使用Tesseract OCR的步骤,包括解决依赖问题、使用Homebrew安装、设置数据路径以及应对可能出现的错误。在Mac上,需要通过brew安装并调整权限;在Linux上,通过源码安装,并解决库路径问题。
摘要由CSDN通过智能技术生成
      这几天为了做一个网站爬虫,涉及到图形验证码的识别,图像这块之前不熟悉,也没时间去琢磨,所以最终选择了开源项目Tesseract-OCR来实现,但是网上大多是windows版本的,当我应用到mac和linux服务器上时遇到了很多坑,寻思可能很多小伙伴也会遇到此类问题,下面就来总结下,也方便自己今后查阅:

废话不多说,先上码:

依赖jar包(我这里用的gradle构建的,maven类似):

compile 'net.java.dev.jna:jna:4.5.0'

compile ('net.sourceforge.tess4j:tess4j:3.4.1'){

    exclude group: 'com.sun.jna', module:'jna'//据说jdk自带的jna包不兼容,所以这里需要exclude掉 

}

import java.io.File;
import net.sourceforge.tess4j.Tesseract;

import net.sourceforge.tess4j.TesseractException;

public class ReadImg {
    public static void main(String args[]){
        File dir = new File("/Users/xx/Desktop/test/img/");  
        File[] files = dir.listFiles();  
        for (File imageFile : files) {  
            Tesseract tessreact = new Tesseract();
            tessreact.setDatapath("/Users/xx/Desktop/test/tessdata");  //语言包文件路径
            try {  
                String result = tessreact.doOCR(imageFile);  
                System.out.println(imageFile.getName()+":"+result);  
            } catch (TesseractException e) {  
                System.err.println(e.getMessage());  
            }  
        }
    }

}

一切看上去都这么简单,运行一下=>各种内裤找不到,于是baidu、googleÿ

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值