图片内容转文字用Java怎么实现？

最新推荐文章于 2024-06-06 09:33:08 发布

殷十娘

最新推荐文章于 2024-06-06 09:33:08 发布

阅读量5.3k

点赞数

分类专栏：架构资料 Java初级

本文链接：https://blog.csdn.net/sincegc/article/details/100525146

版权

1.1 介绍开发具有一定价值的符号是人类特有的特征。对于人们来说识别这些符号和理解图片上的文字是非常正常的事情。与计算机那样去抓取文字不同，我们完全是基于视觉的本能去阅读它们。另一方面，计算机的工作需要具体的和有组织的内容。它们需要数字化的表示，而不是图形化的。有时候，这是不可能的。有时，我们希望自动化的完成用双手从图像重写文本的任务。针对这些任务，光学字符识别（OCR）被设计成一...

摘要由CSDN通过智能技术生成

1.1 介绍

开发具有一定价值的符号是人类特有的特征。对于人们来说识别这些符号和理解图片上的文字是非常正常的事情。与计算机那样去抓取文字不同，我们完全是基于视觉的本能去阅读它们。

另一方面，计算机的工作需要具体的和有组织的内容。它们需要数字化的表示，而不是图形化的。

有时候，这是不可能的。有时，我们希望自动化的完成用双手从图像重写文本的任务。

针对这些任务，光学字符识别（OCR）被设计成一种允许计算机以文本形式“阅读”图形化内容的方法，和人类工作的方式相似。虽然这些系统相对准确，但仍然可能有相当大的偏差。即便如此，修复系统的错误结果也远比手工从头开始要更加容易和快速。

就像所有的系统一样，本质上是相似的，光学字符识别软件在准备好的数据集上进行训练，这些数据集提供了足够多的数据用来帮助学习字符间的差异。如果我们想让结果更加准确，那么这些软件如何学习也是非常重要的话题，不过这将是另外一篇文章的内容了。

与其重新造轮或者想出一个非常复杂（但有用）的解决方案，不如我们先坐下来看看已有的解决方案。

1.2 Tesseract

科技巨头 Google 一直在开发一个 OCR 引擎 Tesseract ，它从最初诞生到现在已有数十年的历史。它为许多语言提供了API，不过我们将专注于 Tesseract 的 Java API 。

很容易使用 Tesseract 来实现一个简单的功能。它主要用于读取计算机在黑白图片上生成的文字，并且结果的准确度较好。但这不是针对真实世界的文本。

对于现实世界中，我们最好使用像谷歌 Vision 这样的更高级的光学字符识别软件，这将在另一篇文章中讨论。

1.2.1 Maven依赖

我们只需要简单的添加一个依赖，就可以将引擎引入到我们的项目：

<dependency>
 <groupId>net.sourceforge.tess4j</groupId>
 <artifactId>tess4j</artifactId>
 <version>3.2.1</version>
</dependency>

1.2.2 光学字符识别

使用 Tes

最低0.47元/天解锁文章

殷十娘

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
图片内容转文字用Java怎么实现？

1.1 介绍开发具有一定价值的符号是人类特有的特征。对于人们来说识别这些符号和理解图片上的文字是非常正常的事情。与计算机那样去抓取文字不同，我们完全是基于视觉的本能去阅读它们。另一方面，计算机的工作需要具体的和有组织的内容。它们需要数字化的表示，而不是图形化的。有时候，这是不可能的。有时，我们希望自动化的完成用双手从图像重写文本的任务。针对这些任务，光学字符识别（OCR）被设计成一...
复制链接

扫一扫

专栏目录