PaddleOCR
文章平均质量分 54
PaddleOCR分为文本检测、文本识别和方向分类器三部分,其中文本检测有三个模型,分别是MobileNetV3、ResNet18_vd和ResNet50,其中最常使用的是MobileNetV3模型,整体比较小,适合应用于手机端。文本识别只有一个MobileNetV3预训练模型。方向分类器使用默认的
一览天下945
每个人都会发光
展开
-
PaddleOCR中如何求两个文件的差集
这种情况就是最终识别的结果要比已有的数据要少,就是有些数据因为一些原因没有标记到检测框,首先,如果数据量小的话,还是可以一张一张地去核对,但是如果数据量是比较大的,尤其是上万的,那么这个时候就需要用代码操作来直接找出哪些数据是被遗漏的,再重新做处理。1.一个存放所有未处理数据的集合,能够很清晰地看到集合中每张照片的名字,便于之后的数据再核对和处理。一个是总数据的路径(Image),一个是识别结果存放的路径(output)希望我写的文章能够让你们得到价值有所收获。2.未处理照片的数量。感谢大家的关注和支持。.原创 2022-07-28 14:05:19 · 323 阅读 · 1 评论 -
如何替换PaddleOCR中的Label.txt文件中识别错的身份证号码
先找到PaddleOCR检测和识别后的结果文件(Label.txt),还有一份正确无误的身份证照片名字和身份证号码对应的文档(rec_shangye.txt),还有替换后的正确的结果文件(Label2.txt) 3.路径 4.创建保存rec_shangye.txt中每行文本内容的列表 5.创建姓名和身份证号码的列表,并把rec_list中的内容添加进去 6.把名称列表和号码列表用键值对的形式保存在new_dict字典中 7.读取Label.txt中的所有内容,并保存在列表中(方便数据处理) 8.两原创 2022-07-28 10:54:19 · 444 阅读 · 0 评论 -
PaddleOCR的rec如何裁剪数据
要注意train,test,val是分三次运行代码的,对应关系要正确原创 2022-06-24 16:13:54 · 451 阅读 · 1 评论 -
PaddleOCR的方向分类器cls如何造数据
1.把照片数据按照奇数偶数分成两个类别,并分别保存到对应的路径并且写入到标签文件中 2.把从两个类别汇集好的数据分开到train和test中,并写入train_label.txt和test_label.txt中原创 2022-06-23 17:49:56 · 575 阅读 · 0 评论