最近突然想写一个图片文字识别的java程序,上网搜集资料,有调用百度云api的,也有用tess4j的。
调用百度云api虽然识别率比较高,但是需要注册百度云api,比较麻烦。
使用tess4j只需下载tess4j的jar包,调用jar包方法即可,很方便,因此本篇文章选用tess4j。
一、首先进入tess4j官网,http://tess4j.sourceforge.net/ ,下载官方zip包。
解压后文件夹,如下图所示:
二、创建java工程,导入dist中的tess4j包,和lib里面的相关的包
三、写main函数
package com.xiajw.tess4j.program;
import java.io.File;
import java.util.Scanner;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
public class TestOcr {
public static void main(String[] args) {
System.out.print("p