PaddleOCR文本检测数据向文本识别数据的格式转换

最新推荐文章于 2025-04-23 16:12:09 发布

great-wind

最新推荐文章于 2025-04-23 16:12:09 发布

阅读量1.3k

点赞数

分类专栏：计算机视觉文章标签： python PaddleOCR

本文链接：https://blog.csdn.net/csdn1e/article/details/120508761

版权

本文介绍如何将PaddleOCR的文本检测数据转换为适合文本识别的格式。转换过程中，需要解决同一图片上多文本标注的问题，以确保符合文本识别的数据集要求。具体做法通过代码实现数据剪裁。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在使用PaddleOCR官方提供的转换工具时出现问题，经过查看数据格式发现以下问题：
文本检测的训练数据，可以在同一张图片上进行多个文本标注，最后形成的数据格式如下：

" 图像文件名                    json.dumps编码的图像标注信息"
ch4_test_images/img_61.jpg    [{
   "transcription": "MASA", "points": [[310, 104], [416, 141], [418, 216], [312, 179]]}, {
   ...}]
...

文本识别的数据集，是一张图片对应一个文本标注，最后格式如下：

" 图像文件名                 图像标注信息 "
train_data/train_0001.jpg   简单可依赖
train_data/train_0002.jpg   用科技让复杂的世界更简单
...

因此，想要使用同一组数据进行文本检测和文本识别训练，需要将文本检测使用的数据集进行剪裁，以满足文本识别的格式要求ÿ

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

great-wind

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

PaddleOCR识别框架解读[14] OCR数据集

我是天才很好

03-13

587

PaddleOCR识别框架解读[14] OCR数据集

OCR技术解析：用Tesseract和PaddleOCR识别文本

最新发布

CSDN博客专家，系统架构师，有合作、疑惑请私信博主。

05-19

3万+

OCR技术解析：用Tesseract和PaddleOCR识别文本，人工智能，计算机视觉，大模型，AI，光学字符识别（Optical Character Recognition，简称 OCR）是一项将图片、扫描件等文档中的文字信息转换为可编辑文本的技术。在数字化时代，OCR 技术广泛应用于文档处理、车牌识别、身份证识别、古籍数字化等领域，极大地提高了文字信息处理的效率。Tesseract 和 PaddleOCR 是两款极具代表性的 OCR 工具。

参与评论您还未登录，请先登录后发表或查看评论

paddleocr识别并按行输出结果

arno1988的专栏

07-19

1461

【代码】paddleocr识别并按行输出结果。

基于PaddleOCR对图片中的excel进行识别并转换成word（一）

神奇侠MAKER

04-23

673

说明：表格要求必须都要剧中显示。

[PaddleOCR]基于PaddleX字体分类的OCR输出优化

m0_63642362的博客

04-22

1262

转自AI Studio，原文链接：[PaddleOCR]基于PaddleX字体分类的OCR输出优化 - 飞桨AI Studio 字体分类本项目是PaddleOCR的其中一个环节。目的是达到对PaddleOCR数据中图片的文字字体类别的识别。 0 汉字图片数据获取(可选) 需要增加字体类别时候再看此大步骤本项目中以及放置了生成好的图片文件，不需要再执行此步骤,但下面的解压还是需要的，会用到里面的字体库 In [] !unzip /home/aistud.

《PaddleOCR》—— OCR

will be blogging

03-11

4468

PaddleOCR 是百度基于飞桨（PaddlePaddle）框架开源的全场景文字识别工具，支持多语言、多场景、高精度的 OCR 能力，覆盖文本检测、识别、方向分类等全流程，广泛应用于文档扫描、车牌识别、票据处理、工业质检等场景。

探索PaddleOCR-json：基于PaddlePaddle的高效OCR工具与JSON格式支持

gitblog_00041的博客

04-16

1090

探索PaddleOCR-json：基于PaddlePaddle的高效OCR工具与JSON格式支持 PaddleOCR-json OCR离线图片文字识别命令行windows程序，以JSON字符串形式输出结果，方便别的程序调用。提供各种语言API。由 PaddleOCR C++ 编译。 ...

PaddleOCR 文本检测数据集COCO转换脚本

qq_42693842的博客

04-16

288

【代码】PaddleOCR 文本检测数据集COCO转换脚本。

基于PaddleOCR的检测-识别数据格式转换技术详解

fudaihb的博客

04-23

696

本文详细阐述了PaddleOCR检测到识别数据格式转换的技术细节，提供了可直接用于生产环境的代码实现，并探讨了多种优化策略。通过合理的数据转换处理，可提升识别模型训练效率30%以上。建议在实际应用中结合具体业务需求，灵活选择转换策略，并持续进行数据质量监控。

基于Python+yolov5+paddleocr开发的新能源汽车车牌检测定位和文本识别（源码+训练好的模型+图片）

05-14

基于Python+yolov5+paddleocr开发的新能源汽车车牌检测定位和文本识别（源码+训练好的模型+图片）使用技术：采用YOLOv5轻量化网络构建新能源车牌检测模型，结合多模态识别技术实现端到端车牌解析。Opencv实时捕获...

PaddleOCR识别框架解读[09] 文本识别--从训练到部署全流程

我是天才很好

03-08

937

PaddleOCR识别框架解读[09] 文本识别--从训练到部署全流程

PaddleOcr训练自己的数据集

luozh990711的博客

11-20

1394

介绍如何使用paddleocr训练自己的数据

PaddlePaddle飞桨OCR文本检测——识别图片文字结果并保存为txt（五）

weixin_42845306的博客

02-17

1万+

此部分只考虑rec识别部分，不考虑检测和方向分类。举个栗子，要识别的图片如下所示：这是paddle自带的图片，也是det检测后的框出来的图片，可以看到，rec识别部分的输入图片，是仅有一行文字，没有其它乱七八糟的东西，也没有多余的空白，非常精炼。在PaddleOCR-dygraph根目录下启动cmd，输入识别图片代码如下： python tools/infer_rec.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_common_train_v2.0.yml

paddleocr - 数据集制作

qq_39066502的博客

06-01

594

准备数据，jpg和json文件放下hone/data/1下面将json和jpg分别拿出来当道json和images文件夹下，方便后面处理。

【PaddleOCR入门】二、配置文件说明

qq_38253797的博客

05-25

2845

目录一、Global二、Optimizer三、Architecture四、Loss (ppocr/losses)五、PostProcess (ppocr/postprocess)六、Metric (ppocr/metrics)七、Dataset (ppocr/data)Reference 一、Global 字段用途默认值备注 use_gpu 设置代码是否在gpu运行 true ⭐️ epoch_num 最大训练epoch数 500 ⭐️ log_smooth_window lo

paddleocr检测模型训练记录

雪剑封心

11-24

1220

PaddleOCR主目录下，自己新建文件夹：car_plate_images/images_det。注意：标注好的标签文件，txt文件内的图片名称前面是不需要路径的，删除多余路径，我才能正常训练。训练后保存位置–新建文件夹：./output/ch_ppocr_mobile_v2.0_det/ch_det_mv3_db_v2.0.yml_car_plate.yml文件内修改。det_label_test、det_label_train、是标签文件。再测试，将原来的测试路径换成现在训练好的模型路径。

PaddleOCR模型训练及使用详细教程

Elaine的博客

01-25

1万+

PaddleOCR是基于PaddlePaddle深度学习框架的开源OCR工具，但它提供了推理模型/训练模型/预训练模型，用户可以直接使用推理模型进行识别，也可以对训练模型或预训练模型进行再训练。支持约80种语言的文本识别，并具有较高的准确性和速度。

标注文件格式转换：xml和json相互转化、xml和txt相互转化、txt和json相互转化

weixin_44944382的博客

05-16

3216

1、xml转json #coding:utf-8 import os import glob import json import shutil import numpy as np import xml.etree.ElementTree as ET # 项目根目录下放置data/coco文件夹，里面分别有annotations、train2017、val2017三个文件夹。 # 格式转化前要将xml和图片全部放入annotation文件夹中，train2017、val2017里面为空。 # 转换后生成的

搞定系列：paddleocr训练自己数据集windows版

12-25

paddleocr训练自己数据集windows版是一门专门适合初学者训练自己的paddleocr模型教程。通过本教程您可以收获：（1）学会在windows上安装自己的显卡驱动（2）学会在windows上安装cuda+cudnn（3）学会在windows上安装anaconda3（4）学会在windows安装PPOCRLabel以及使用PPOCRLabel标注自己的数据集（5）学会使用paddleocr训练文本检测模型（6）学会使用paddleocr训练文本识别模型（7）学会使用paddleocr导出自己的模型（8）学会使用paddleocr测试自己的模型