linux tesseract 中文包,Java——Tess4J（Tesseract的中文包的应用）

最新推荐文章于 2024-04-26 10:53:08 发布

weixin_39760068

最新推荐文章于 2024-04-26 10:53:08 发布

阅读量274

点赞数

文章标签： linux tesseract 中文包

现在网上找到的都是很粗暴的，直接安装好环境后，用command在linux的tesseract安装包下打出 tesseract image.png testresult -l chi_tra 这样的命令行，得到testresult.txt结果，读取内容后再删除图片和testresult.txt

这样效率差，而且识别效果也差

测试后发现，输入一个中文字的图片，使用代码可以识别而使用命令行则无法识别

而代码却又及其简答，不知为何没有人会用，囧RZ

代码如下：

public class TraditionalNameTesseract implements TesseractOCR{

@Override

public String ocrWithMat(Mat mat) {

Tesseract instance = new Tesseract();

if(OpencvXTess4jConfig.tessdataPath!=null){

instance.setDatapath(OpencvXTess4jConfig.tessdataPath);

}

instance.setLanguage("chi_tra");

BufferedImage bi = new MatToBufImg(mat,".png").getImage();

String result =null;

try {

result = instance.doOCR(bi);

result = result.trim();

} catch (TesseractException e) {

e.printStackTrace();

}

return result;

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39760068

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

java tesseract_Java中使用tess4J（Tesseract-OCR）进行图片文字识别（支持中文）

weixin_32647107的博客

02-20

2150

Java 版本：至少1.7java中识别文字比较简单，使用的软件是tesseractocr(使用的版本是3.02，3以后的版本才支持中文)，这个软件需要安装在本地电脑中，安装的过程中全部都按照默认进行安装(以便于Java直接调用)，建议使用winRAR解压。winRAR下载地址： http://download.csdn.net/download/wsk1103/10150343tess4J...

Tess4J-3.4.7（包含最新中文语音包）

04-27

参与评论您还未登录，请先登录后发表或查看评论

linux tesseract-ocr-3.02.02(含中文、英文语言包)

06-15

linux 安装图像识别系统 tesseract-ocr-3.02.02(含中文、英文语言包) 含所需包 leptonica-1.71.tar.gz tesseract-ocr-3.02.02.tar.gz chi_sim.traineddata eng.traineddata

linux java tesseract_Linux + Java 实现图文识别，图文提取

weixin_36408867的博客

02-12

160

附带Controlle接口写法/*** 返回状态和内容的实体类*/@Data@AllArgsConstructor@NoArgsConstructorpublic class BaseResult {private Integer code; // 0:请求失败 1：请求成功private Object data; //错误的原因或者正确的内容}/*** 图文提取* @param...

Linux文字识别软件,linux下的文字识别软件tesseract ( OCR software in Linux: tesseract )

weixin_33134753的博客

05-03

913

linux下的文字识别软件tesseract ( OCR software in Linux: tesseract )2012-10-11 12:04访问量: 5317分类：技术WINDOWS下有汉王OCR识别，免费的LINUX世界有啥与之对应呢？我找到了tesseract.Ubuntu下的安装步骤： (setup steps under ubuntu )1.安装对应的lib (install...

Java——Tess4J（Tesseract的中文包的应用）

Clare_0_0专栏

12-08

5439

现在网上找到的都是很粗暴的，直接安装好环境后，用command在linux的tesseract安装包下打出 tesseract image.png testresult -l chi_tra 这样的命令行，得到testresult.txt结果，读取内容后再删除图片和testresult.txt 这样效率差，而且识别效果也差测试后发现，输入一个中文字的图片，使用代码可以识别而使用命令行则无法识

tesseract-ocr 4.1.1 linux安装包+离线依赖包+中文语言包+示例截图+离线安装文档

10-30

tesseract-ocr linux安装包+离线依赖包+中文语言包+示例截图+离线安装文档。2020-10-28 亲测可用，截图为证。tesseract最新版本4.1.1。文档：https://blog.csdn.net/zhaohuihua/article/details/109340779

开源OCR引擎Tesseract的Java API封装Tess4J

10-28

开源OCR引擎Tesseract的Java API封装Tess4J。下载后需要自己编译生成jar文件，再按照说明导入到程序中使用。识别率比Asprise高不少。但注意此引擎需要在32位JVM下运行，只支持Windows。

tesseract.exe以及tess4j-4.5.3.jar

09-23

综上所述，Tesseract.exe和Tess4J-4.5.3.jar的组合为Java开发者提供了一种强大的OCR解决方案，能够在Java应用中方便地识别和处理图像中的文本。通过理解和熟练运用这两个工具，可以提升文本处理自动化的工作效率。

centos7部署tesseract并实现java+tess4j进行图片识别

03-03

### CentOS 7 部署 Tesseract OCR 并结合 Java 和 Tess4J 实现图片识别 #### 一、概述 Tesseract 是一个开源的光学字符识别（Optical Character Recognition, OCR）引擎，由 Google 主导维护。它可以识别多种格式...

tess4j(图像识别)java微服务linux运行所需库文件

03-31

tess4j微服务或maven项目的jar包自带window的动态链接库文件，但是不适配linux，需要自行编译创建，使用版本tesseract-4.1.1.tar.gz、leptonica-1.74.4，编译比较耗时繁琐，以来的库比较多，使用直接将解压后的文件...

tess4J中文库.rar

08-31

tess4J中文库，可智能识别图片中的中文，需配合Tess4J使用

Tess4J资源包.zip

08-31

Tess4J资源包，可ocr识别图片的数字，中文，英文等

Tess4j+中文识别+使用介绍文档+参考网址="最终几行代码实现图片中的文字识别"

04-09

下载后是一个Java工程,使用的开发工具为IDEA,Eclips开发者可将src目录下Java 文件进行拷贝即可,lib依赖相应导入,点击已实现功能的Main.java 类直接运行即可实现图片中文字识别【注】:识别所需的语言包需使用和src同级目录的 tessdata目录下的资源，之前失败的朋友都是没有使用该文件夹下的语言包资源

tess4j语言库.rar

07-31

tess4j 实现图片识别：语言库chi_sim.traineddata和eng.traineddata

Java - 在Linux系统上使用OpenCV和Tesseract

最新发布

软件测试入门笔记

04-26

1123

7、执行命令：make，开始编译，经过较长时间的等待，如果进度到100%且没有报错，则编译完成；此时build目录下生成了一系列文件，其中lib目录中，就有我们需要的libopencv_java249.so文件，此外bin目录中，还生成了opencv-249.jar这个jar包文件。2）CMAKE_INSTALL_PREFIX=/usr/local/app/install，指定了opencv的安装目录（install也是自己新建的），如果只是为了编译得到.so文件，此参数可以不写；

linux java tesseract_linux tesseract 安装及部署tess4j项目的常见问题

weixin_36122351的博客

02-17

393

linux上部署tess4j项目在windows上项目是可以正常运行的，部署到Linux上后，运行报异常，异常内容为：Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract)这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件，windows是.dll文件)...

Linux文字识别软件,linux下的文字识别软件tesseract

weixin_39989973的博客

05-03

576

Ubuntu下的安装步骤： (setup steps under ubuntu )1.安装对应的lib (install the libs)sudo apt-get install autoconf automake libtoolsudo apt-get install libpng12-devsudo apt-get install libjpeg62-devsudo apt-get inst...

java使用Tess4J时遇到的问题

06-02

Tess4J 是一个基于 Tesseract OCR 引擎的 Java 包装器，用于识别文本。在使用 Tess4J 时，可能会遇到以下问题： 1. 找不到 JNI 库如果在使用 Tess4J 时出现 "java.lang.UnsatisfiedLinkError" 异常，这可能是因为...