java ocr数字识别_Java OCR tesseract 图像智能文字字符识别技术实例代码

接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下Java实现的例子。

1afdff12967bc6afd9129c0049be483a.png

拿代码扫描上面的图片,然后输出结果。主要思想就是利用Java调用系统任务。

下面是核心代码:

package com.zhy.test;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.util.ArrayList;

import java.util.List;

import org.jdesktop.swingx.util.OS;

public class OCRHelper

{

private final String LANG_OPTION = "-l";

private final String EOL = System.getProperty("line.separator");

/**

* 文件位置我防止在,项目同一路径

*/

private String tessPath = new File("tesseract").getAbsolutePath();

/**

* @param imageFile

* 传入的图像文件

* @param imageFormat

* 传入的图像格式

* @return 识别后的字符串

*/

public String recognizeText(File imageFile) throws Exception

{

/**

* 设置输出文件的保存的文件目录

*/

File outputFile = new File(imageFile.getParentFile(), "output");

StringBuffer strB = new StringBuffer();

List cmd = new ArrayList();

if (OS.isWindowsXP())

{

cmd.add(tessPath + "\\tesseract");

} else if (OS.isLinux())

{

cmd.add("tesseract");

} else

{

cmd.add(tessPath + "\\tesseract");

}

cmd.add("");

cmd.add(outputFile.getName());

cmd.add(LANG_OPTION);

// cmd.add("chi_sim");

cmd.add("eng");

ProcessBuilder pb = new ProcessBuilder();

/**

*Sets this process builder's working directory.

*/

pb.directory(imageFile.getParentFile());

cmd.set(1, imageFile.getName());

pb.command(cmd);

pb.redirectErrorStream(true);

Process process

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值