springboot实现OCR

最新推荐文章于 2024-04-29 20:54:10 发布

橙子橙

最新推荐文章于 2024-04-29 20:54:10 发布

阅读量821

点赞数 9

文章标签： spring boot ocr java

本文链接：https://blog.csdn.net/baidu_35760874/article/details/135363724

版权

1、引入依赖

<dependency>
	<groupId>net.sourceforge.tess4j</groupId>
	<artifactId>tess4j</artifactId>
	<version>4.5.4</version>
</dependency>

2、config

@Configuration
public class TessOcrConfiguration {

   @Bean
   public Tesseract tesseract() {
      Tesseract tesseract = new Tesseract();
      // 设置训练数据文件夹路径
      tesseract.setDatapath("D:/tessdata");
      // 设置为中文简体
      tesseract.setLanguage("chi_sim");
      return tesseract;
   }
}

3、定义api

@PostMapping(value = "/ocr", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)
public String ocr(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {
    return weChatService.ocr(file);
}

4、定义service

@Resource
private Tesseract tesseract;

@Override
public String ocr(MultipartFile file) throws TesseractException, IOException {
    InputStream sbs = new ByteArrayInputStream(file.getBytes());
    BufferedImage bufferedImage = ImageIO.read(sbs);
    return tesseract.doOCR(bufferedImage);
}

5、将官方的简体中文训练数据（后缀为.traineddata的文件）放到配置的目录（D:/tessdata）下

下边是官方训练数据的下载地址，打开后可以找到简体中文的文件 chi_sim.traineddata，下载下来放到指定位置就可以了

tess4j官方训练数据下载https://digi.bib.uni-mannheim.de/tesseract/tessdata_fast/6、测试效果

测试图片

postman调用

可以发现【霜】被识别成了【需】，说明还是有一定的误差

橙子橙

关注

9
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
springboot实现OCR

下边是官方训练数据的下载地址，打开后可以找到简体中文的文件 chi_sim.traineddata，下载下来放到指定位置就可以了。5、将官方的简体中文训练数据（后缀为.traineddata的文件）放到配置的目录（D:/tessdata）下。可以发现【霜】被识别成了【需】，说明还是有一定的误差。tess4j官方训练数据下载。4、定义service。
复制链接

扫一扫