首先需要下载orc软件,这里使用tesseract-orc软件好了
下载地址:点击下载
下载好了,就安装。
我们可以测试一下,在命令行输入tesseract
会出现以下情况
如果没有出现以下情况,需要手动的配置环境变量,方法如下:将安装目录添加到path中。
由于有的验证码有干扰点和颜色差,这里提供源码,将图片进行处理。
ClearImageHelper.java
import java.awt.Color;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import javax.imageio.ImageIO;
public class ClearImageHelper {
public static void main(String[] args) throws IOException {
cleanImage(new File("1.jpg"), "2.jpg");
}
// sfile是带处理的图像
// destDir是处理后保存的路径
public static void cleanImage(File sfile, String destDir) thro