整合Tess4J实现OCR图片识别技术

1. 什么是OCR


**OCR (Optical Character Recognition,光学字符识别)指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程. **


2. 什么是Tess4J库?

**Tess4J是一个开源的Java库,它为Tesseract OCR(光学字符识别)引擎提供了一个简单的Java API。Tesseract是一个强大的开源OCR引擎,可以将图像中的文本转换为可编辑的文本。Tess4J使得在Java应用程序中使用Tesseract OCR变得更加容易。 **


主要功能和特点

  • 文本提取:能够从图像中提取文本,包括印刷文本和手写文本。
  • 多语言支持:支持多种语言的OCR,包括但不限于英语、中文、日语、韩语等。
  • 简单的API:提供了易于使用的Java API,使开发者可以轻松地将OCR功能集成到他们的Java应用程序中。
  • 扩展性:支持自定义词典和训练数据,以提高特定应用场景下的OCR准确性。
  • 图像处理:支持基本的图像处理功能,如图像预处理,以提高OCR的准确性。

3. 引入依赖

<!-- tess4j -->
<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.4</version>
</dependency>

4. 下载默认的训练数据

训练数据下载地址

image.png


5. 配置训练数据的目录路径

# 训练数据文件夹的路径
tess4j:
  datapath: E:\Software\trainData # 注意改成自己的文件路径

6. 测试代码

6.1 TesseractOcrConfig
/**
 * @author Ccoo
 * 2024/7/19
 */
@Configuration
public class TesseractOcrConfig {

	@Value("${tess4j.datapath}")
	private String dataPath;

	@Bean
	public Tesseract tesseract() {

		Tesseract tesseract = new Tesseract();
		// 设置训练数据文件夹路径
		tesseract.setDatapath(dataPath);
		// 设置为中文简体
		tesseract.setLanguage("chi_sim");
		return tesseract;
	}
}

6.2 OcrController
/**
 * @author Ccoo
 * 2024/7/19
 */
@RequestMapping("/ocr")
@RestController
@AllArgsConstructor
public class OcrController {

	private final OcrService ocrService;

	@PostMapping(value = "/recognize", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)
	public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {

		// 调用OcrService中的方法进行文字识别
		return ocrService.recognizeText(file);
	}

}

6.3 OcrService
public interface OcrService {

    String recognizeText(MultipartFile file) throws IOException, TesseractException;

}

6.4 OcrServiceImpl
/**
 * @author Ccoo
 * 2024/7/19
 */
@Service
@AllArgsConstructor
public class OcrServiceImpl implements OcrService {

	private final Tesseract tesseract;

	/**
	 * 识别图片中的文字
	 * @param imageFile 图片文件
	 * @return 文字信息
	 */
	public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException {

		// 转换
		InputStream sbs = new ByteArrayInputStream(imageFile.getBytes());
		BufferedImage bufferedImage = ImageIO.read(sbs);

		// 对图片进行文字识别
		return tesseract.doOCR(bufferedImage);
	}
}

7. 功能测试

image.png


7.1 调试请求接口

image.png
image.png


7.2 测试结果

image.png

默认训练库的识别率还是可以的, 对于需要识别率更高的, 需自行训练!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值