带你走进神奇的识图世界
神奇的识别图片文字代码
你好! 这可能是你第一次使看到ShyMing 的csdn博客。如果你想持续看到我的新品, 可以关注我,获取最新博客信息。可以仔细阅读这篇文章,了解一下tessdata工具包的使用。
解决步骤
使用tesseract-ocr
步骤 | 操作 | 详情 |
---|---|---|
第一步 | 下载testdata训练文件 | testdata下载地址 |
第二步 | 解压tessdata | 放置在tessdata目录 |
第三步 | 设置环境变量 | 在path变量中加入tessdata目录 |
第四步 | 添加maven依赖 | jna/tess4j |
1.https://github.com/tesseract-ocr/tessdata下载testdata训练文件
2.将训练文件放入安装目录下的tessdata目录中
3.配置环境变量,在path变量中加入tessdata目录,例如C:\Program Files\testdata
4.添加maven依赖
<!--识别图片文字-->
<dependency>
<groupId>net.java.dev.jna</groupId>
<artifactId>jna</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.4.0</version>
<exclusions>
<exclusion>
<groupId>com.sun.jna</groupId>
<artifactId>jna</artifactId>
</exclusion>
</exclusions>
</dependency>
漂亮的识别图片代码
public static String ptw(String language,String picture_name,String path){//"rus.png"
//加载待读取图片
File imageFile = new File(path+picture_name);
//创建tess对象
ITesseract instance = new Tesseract();
//设置训练文件目录
instance.setDatapath("D://tessdata");
//设置训练语言
instance.setLanguage(language);
// chi_sim(中文)
// eng(英文)
// rus(俄文)
//jpn(日文)
//执行转换
try {
String result = instance.doOCR(imageFile);
System.out.println(result);
return result;
} catch (TesseractException e) {
e.printStackTrace();
}
return null;
}
如图
调用代码
//路径
String path = "D:\\development\\code\\bfd\\ReadingMe\\src\\main\\resources\\";
// chi_sim(中文)
// eng(英文)
// rus(俄文)
//jpn(日文)
System.out.println(ptw("chi_sim","chi.png",path));
结果展示