java代码实现图片内容转文字
前言
在找Java图片转文字的资料时,找到的资料很多都不全面,经过不断的搜集,才找到差不多的一些资料,整理用作后期备份吧:
1、使用的springboot的maven进行导入tess4j的jar包。
pom.xml配置文件设置
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>3.2.1</version>
</dependency>
test.java
@RestController
@RequestMapping("/hello")
public class HelloController {
@GetMapping("/say")
public String sayHello(){
return "Hello Spring";
}
@RequestMapping("picture")
public String picture(){
Tesseract tesseract = new Tesseract();
String picturePath ="C:/Users/pc/Desktop/testpicture";
tesseract.setDatapath(picturePath);
String s="";
try {
s = tesseract.doOCR(new File("C:/Users/pc/Desktop/picturetest.jpg"));
} catch (TesseractException e) {
e.printStackTrace();
}
return s;
}
}
2.tesseract.setDatapath(picturePath)这一行主要是在设置LSTM数据集,获取方式网址是:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
里面什么语言都有,也有这项技术的简介。
3、可以使用下载的资源中的eng.traineddata,chi_sim.traineddata两个文件,eng代表英文的,chi_sim代表简体中文的,每种语言对应一个训练好的模型文件。
里面什么语言都有,也有这项技术的简介。
3.new File(“C:/Users/pc/Desktop/picturetest.jpg”)主要是在设置相关图片的资源
4、启动项目,在页面访问项目路径就能获取到识别到的结果。