PaddleOCR中如何求两个文件的差集

一览天下945

已于 2022-07-28 14:08:20 修改

阅读量373

点赞数 1

分类专栏： PaddleOCR 文章标签： python 人工智能数据挖掘

于 2022-07-28 14:05:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38500228/article/details/126031644

版权

本文介绍了在使用PaddleOCR过程中，如何处理检测框不准确和识别结果缺失的问题。通过将所有图片路径转化为集合并计算差集，找出未被正确识别的数据，以便进一步处理和训练。

摘要由CSDN通过智能技术生成

PaddleOCR中如何求两个文件的差集

1.检测框不准确或者识别错误
2.有些数据没有识别结果

1.检测框不准确或者识别错误

PaddleOCR中会有检测器（det）和识别器（rec），对已有的图片进行检测识别，会有一些检测框不准确或者识别错误的情况，这个时候需要把那些错误的数据都找出来，单独放在一个文件夹中，然后去总数据中对这些有问题的数据重新标好检测框和识别结果，然后再在之后进行训练

2.有些数据没有识别结果

这种情况就是最终识别的结果要比已有的数据要少，就是有些数据因为一些原因没有标记到检测框，首先，如果数据量小的话，还是可以一张一张地去核对，但是如果数据量是比较大的，尤其是上万的，那么这个时候就需要用代码操作来直接找出哪些数据是被遗漏的，再重新做处理。

2.1 导包

import os

2.2 路径

一个是总数据的路径（Image），一个是识别结果存放的路径（output）

image_path = "C:/Users/86775/Desktop/Image/"
output_path =

最低0.47元/天解锁文章

一览天下945

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一览天下945

博客等级

码龄7年

19
原创

98
点赞

292
收藏

23
粉丝

关注

私信

热门文章

分类专栏

最新评论

windows中cuda版本的切换
World_happy: 非常感谢！但是提醒一下大家，切换完上下位置之后，先把命令行关掉，再重新开，之后输入nvcc -V才会出现效果（我的是这样子的）！
Fate单机部署（docker版本）
Nebula的notebook: 博主你好，想问一下，4，2的参考链接中分为docker的安装和镜像的安装，我看您只引用了docker的安装，我们是不需要座镜像的安装吗？
联邦学习数学公式纯手推
Rain_Hpu: 那神经网络的情况下，不论是多分类还是二分类任务，最后的那个损失函数l对输出结果z的值都是概率值减真值吗
PaddleOCR的rec如何裁剪数据
��彡: 你好我想问一下，如果我想改成多点标注的裁剪怎么弄呢？您的程序是4点标注的，我想改成14点标注，但是一直报错，而且报错一直无法解决 cv2.error: OpenCV(4.6.0) D:\a\opencv-python\opencv-python\opencv\modules\imgproc\src\imgwarp.cpp:3392: error: (-215:Assertion failed) src.checkVector(2, CV_32F) == 4 && dst.checkVector(2, CV_32F) == 4 in function 'cv::getPerspectiveTransform'我确定把两个参数都改成float32了，还是不能运行，请问有没有办法解决呢
联邦学习数学公式纯手推
一览天下945: 能帮到你就行，不客气

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。