JavaCV进阶之tesserac教程
文章平均质量分 93
请优先订阅合集,不建议单独购买本专栏。tesserac是google开源的文字识别库。本专栏主要用于讲解如何使用JavaCV调用tesserac来实现文字识别。
tesserac作为javaCV库的一部分,极大的拓展了javacv在文字识别领域的处理能力。建议订阅合集
eguid_1
专注于音视频流媒体、计算机视觉以及计算机图形技术的探索与实践(JavaCV教程、FFmpeg教程、openCV图像处理教程)
展开
-
javaCV文字识别篇汇总:Tesseract介绍,Java如何使用Tesseract识别字符,如何使用Tesseract训练中文数据模型,Tesseract支持哪些格式标注数据
Tesseract 是一个开源的 OCR(光学字符识别)引擎,最初由惠普实验室开发,后来由 Google 接管并开源。OCR 是一种将图像中的文本转换为可编辑文本的技术,它可以自动识别图像或扫描文档中的文字,并将其转换为数字形式。Tesseract 在处理标准字体、清晰图像时具有很高的识别准确性,可以准确地识别各种字体和字号的文字。Tesseract 支持多种语言的文字识别,包括英语、中文、日语、西班牙语等,使其在全球范围内具有广泛的应用。原创 2024-05-14 22:23:48 · 752 阅读 · 3 评论 -
锋利的javaCV文字识别篇之二:视频文字识别和视频提取字幕文字字符
前言上一章我们实现了图片的文字识别和提取,本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。读取视频帧javacv已经帮我们封装好了,直接就可以读取到视频帧,麻烦的是,测试的时候发现javacv设置像素格式不起效果,所以我们只能通过BufferedImage进行转换后才能进行图片文字识别,性能上肯定会有折扣,后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给t原创 2020-05-10 23:30:57 · 5327 阅读 · 1 评论 -
锋利的javaCV文字识别篇之一:基于tesserac ocr检测识别图片文字,不仅跨平台还支持英文中文简体繁体等各种字符识别
前言本篇文章属于javacv系列的扩展篇。我们之前已经通过javacv实现了流媒体这块的音视频编解码等等操作,还有图像处理,虽然使用opencv也可以实现文字识别,但是识别率不高,所以来试试google开源的tesserac ocr看看效果。我们分为三步就可以做到实现:首先,我们要添加依赖;次之,准备资源(需要训练好的语言包以及需要进行识别的图片,这里会提供最新的英文版下载以及中文简繁体下载地址);最后就开始编写代码。废话少说,立刻开始吧。1、添加依赖(1)gradle方式原创 2020-05-09 18:04:24 · 7467 阅读 · 7 评论