
★★★ 本文源自AlStudio社区精品项目,【点击此处】查看更多精品内容 >>>

v1.2 2023-05-18
  • 隐藏部分log
  • 增加模型config说明
  • 其他描述优化
v1.1 2023-05-15
  • 由于文件数量限制,公开部分训练数据
  • 由于文件大小限制,公开部分模型


【GitHub id】megemini




【技术思路简介】:利用 PaddleSeg/PaddleClas/PaddleOCR 完成全流程工频场强计读数识别。

本文为《PaddlePaddle Hackathon 飞桨黑客马拉松第四期》中任务:

【Hackathon 4th】No.236:基于PaddleOCR的工频场强计读数识别


import glob
import cv2
import json
import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline



识别工频场图像中的工频电磁场数值和单位、以及下方X\Y\Z的数值,要求结构化输出结果: [ {“Info_Probe”:“”}, {“Freq_Set”:“”}, {“Freq_Main”:“”}, {“Val_Total”:“”},{“Val_X”:“”}, {“Val_Y”:“”}, {“Val_Z”:“”}, {“Unit”:“”}, {“Field”:“”} ]



任务提供了100张原始图片,但是不提供标签信息,建议结合 PPOCRLabel 等标注工具构建训练数据并进行模型微调;可以使用数据生成方法批量生成识别数据。


  • 分辨率高,都是 3840×2160 分辨率的图片
  • 虽然分辨率高,但是仪器显示部分所占比例较小
  • 屏幕中的具体关键信息所占比例更小
  • 总共包含两种仪器的图片
  • 关键信息有空值
  • 总量较少
plt.imshow(cv2.imread('./work/data/train/WIN_20230220_14_56_27_Pro.jpg')[..., ::-1])
<matplotlib.image.AxesImage at 0x7f07779da850>



  • 如果直接利用原图进行训练与识别,那么训练必然很慢
  • 如果缩小图片进行训练与识别,必然降低识别精度


  • 第一阶段,仪表显示屏幕分割
  • 第二阶段,仪表显示屏幕分类
  • 第三阶段,生成关键部位Mask
  • 第四阶段,Finetune训练识别模型


  • PaddleOCR,用于识别模型
  • PaddleClas,用于分类仪器
  • PaddleSeg,用于分割图片中的显示屏
  • OpenCV,用于图片相关操作
  • Label Studio,用于标注显示屏、关键信息

整体流程包括 模型训练图片识别 两部分:


首先,需要准备环境,将 PaddleOCR/PaddleClas/PaddleSeg 下载下来并安装。


  • %%capture 用于控制不显示输出,如果第一次安装,可以注释掉这个控制符。
  • 由于此notebook调试时不是一次性完成的,不需要关注此notebook的执行顺序数字,个人使用时,从上至下顺序执行即可。
  • 使用此notebook可以完整的实现训练与识别的流程,中间有几处需要手动操作(如手动标注)要特别注意,不然可能导致流程跑不通。
  • 由于每个人标注的多少会有不同,以及随机数等因素,最终结果可能略有差异。

!git clone https://github.com/PaddlePaddle/PaddleOCR.git
!git clone https://github.com/PaddlePaddle/PaddleClas.git
!git clone https://github.com/PaddlePaddle/PaddleSeg.git

!pip install -r PaddleOCR/requirements.txt
!pip install -e PaddleOCR/

!pip install -r PaddleClas/requirements.txt
!pip install -e PaddleClas/

!pip install -r PaddleSeg/requirements.txt
!pip install -e PaddleSeg/


1. 第一阶段,仪表显示屏幕分割

1.1 生成 512×512 的小图



!mkdir ./work/data/step_1_512_img

for filename in glob.glob('./work/data/train/*.jpg'):
    img = cv2.imread(filename)
    cv2.imwrite('./work/data/step_1_512_img/'+filename.split('/')[-1], cv2.resize(img, (512, 512)))

1.2 标注仪器显示部分

打包下载上面的 step_1_512_img 图片,然后用 LabelStudio 进行标注。

标注完之后,将 json 格式的标注文件上传上来,并进行格式的转换。

这里先转换为 Labelme 的格式,将转换之后的文件放到 ./work/data/step_1_512_img_anno_seg_box.json

这里也可以直接转换为 PaddleSeg 的格式,或者直接使用 PaddleSeg 的 EISeg 工具进行标注。

1.3 转换为 PaddleSeg 的格式

with open('./work/data/step_1_512_img_anno_seg_box.json') as f:
    labels = json.load(f)

file_count = 0
for data in labels:
    _data = {
        "imagePath": None,
        "shapes": [],
    _image = data['data']['image'].split('-')[-1]
    _data['imagePath'] = _image
    for _anno in data['annotations']:
        _shape = {
            "points": [],
            "group_id": None,
            "description": "",
            "shape_type": "polygon",
            "flags": {}
        for _result in _anno['result']:
            _value = _result['value']
            _shape['points'] = [
                [int(float(p[0])*512/100), int(float(p[1])*512/100)] # 注意,LabelStudio记录的是百分比,要做像素的转换
                for p in _value['points']]
            _shape['label'] = _value['polygonlabels'][0]

    _filename = _image.split('.')[0]+'.json'
    with open('./work/data/step_1_512_img/'+_filename, 'w') as f:
        json.dump(_data, f)
        file_count += 1

print('Done with {} anno files...'.format(file_count))
Done with 99 anno files...

将上面 Labelme 格式的数据用 PaddleSeg 自带的工具转换为 PaddleSeg 使用的标注格式。

!python ./PaddleSeg/tools/data/labelme2seg.py ./work/data/step_1_512_img

1.4 划分PaddleSeg训练集与验证集


!mkdir ./work/data/step_1_seg
!mkdir ./work/data/step_1_seg/images
!mkdir ./work/data/step_1_seg/labels

!cp ./work/data/step_1_512_img/*.jpg ./work/data/step_1_seg/images/
!cp ./work/data/step_1_512_img/annotations/* ./work/data/step_1_seg/labels/

!python ./PaddleSeg/tools/data/split_dataset_list.py \
    ./work/data/step_1_seg \
    images \
    labels \
    --split 0.7 0.3 0 --format jpg png

1.5 训练PaddleSeg模型

这里使用 PPLiteSeg 进行模型的训练,配置文件主要需要关注:

batch_size: 4
iters: 1000

  type: Dataset
  dataset_root: /home/aistudio/work/data/step_1_seg # 数据集的目录
  train_path: /home/aistudio/work/data/step_1_seg/train.txt # 生成的训练样本
  num_classes: 2 # 二分类模型
  mode: train

  type: Dataset
  dataset_root: /home/aistudio/work/data/step_1_seg # 数据集的目录 
  val_path: /home/aistudio/work/data/step_1_seg/val.txt # 生成的验证样本
  num_classes: 2

model: # 所使用的模型
  type: PPLiteSeg
    type: STDC2
    pretrained: https://bj.bcebos.com/paddleseg/dygraph/PP_STDCNet2.tar.gz

!python ./PaddleSeg/tools/train.py \
       --config ./work/configs/pp_liteseg_optic_disc_512x512_1k.yml \
       --do_eval \
       --use_vdl \
       --save_interval 1000 \
       --save_dir output

分割模型的 mIoU 0.9805,可以很好的分割出仪表的显示屏。

1.6 生成显示屏小图


!python ./PaddleSeg/tools/predict.py \
       --config ./work/configs/pp_liteseg_optic_disc_512x512_1k.yml \
       --model_path ./output/best_model/model.pdparams \
       --image_path ./work/data/step_1_seg/images \
       --save_dir ./work/data/

2023-04-25 22:43:11 [INFO]	Predicted images are saved in ./work/data/added_prediction and ./work/data/pseudo_color_prediction .


def get_contours(img):
    img = cv2.dilate(img,np.ones((9,9)),iterations=1)

    biggest = np.array([])
    maxArea = 0
    contours,hierarchy = cv2.findContours(img[..., 1], cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)

    for cnt in contours:
        area = cv2.contourArea(cnt)
        if area>1000:
            peri = cv2.arcLength(cnt,True)
            approx = cv2.approxPolyDP(cnt,0.1*peri,True)
            if area > maxArea and len(approx) == 4:
                biggest = approx
                maxArea = area
    return biggest

def reorder(myPoints):
    myPoints = myPoints.reshape((4,2))
    myPointsNew = np.zeros((4,1,2),np.int32)
    add = myPoints.sum(1)
    myPointsNew[0] = myPoints[np.argmin(add)]
    myPointsNew[3] = myPoints[np.argmax(add)]
    diff = np.diff(myPoints,axis=1)
    myPointsNew[1]= myPoints[np.argmin(diff)]
    myPointsNew[2] = myPoints[np.argmax(diff)]
    return myPointsNew

def getWarp(img, biggest, width=512, height=512):
    widthImg = img.shape[0]
    heightImg = img.shape[1]

    biggest = reorder(biggest)
    pts1 = np.float32(biggest)
    pts2 = np.float32([[0, 0], [widthImg, 0], [0, heightImg], [widthImg, heightImg]])
    matrix = cv2.getPerspectiveTransform(pts1, pts2)
    imgOutput = cv2.warpPerspective(img, matrix, (widthImg, heightImg))

    imgCropped = imgOutput[20:imgOutput.shape[0]-20,20:imgOutput.shape[1]-20]
    imgCropped = cv2.resize(imgCropped,(width,height))

    return imgCropped

def get_det_img(img, img_raw, biggest):
    h, w, _ = img.shape
    _h, _w, _ = img_raw.shape

    biggest = biggest.astype(float)

    biggest[..., 0] = biggest[..., 0]/w
    biggest[..., 1] = biggest[..., 1]/h

    biggest[..., 0] = (biggest[..., 0] * _w)
    biggest[..., 1] = (biggest[..., 1] * _h)

    biggest = biggest.astype(int)

    return getWarp(img_raw, biggest)

_img = np.random.choice(glob.glob('./work/data/pseudo_color_prediction/*.png'))
filename = _img.split('/')[-1].split('.')[0]+'.jpg'
print(_img, filename)

img = cv2.imread(_img)
img_raw = cv2.imread('./work/data/train/'+filename)

biggest = get_contours(img)
img_det = get_det_img(img, img_raw, biggest)

plt.figure(figsize=(16, 6))
plt.imshow(img[..., ::-1])

plt.imshow(img_raw[..., ::-1])

plt.imshow(img_det[..., ::-1])   

./work/data/pseudo_color_prediction/WIN_20230220_15_54_52_Pro.png WIN_20230220_15_54_52_Pro.jpg

<matplotlib.image.AxesImage at 0x7fc9c3851ee0>




!mkdir ./work/data/step_1_screen

count_screen = 0
for _img in glob.glob('./work/data/pseudo_color_prediction/*.png'):
    filename = _img.split('/')[-1].split('.')[0]+'.jpg'

    img = cv2.imread(_img)
    img_raw = cv2.imread('./work/data/train/'+filename)

    biggest = get_contours(img)
    img_det = get_det_img(img, img_raw, biggest)

    cv2.imwrite('./work/data/step_1_screen/'+filename, img_det)
    count_screen += 1

print('Done with {} screen files...'.format(count_screen))
Done with 99 screen files...


2. 第二阶段,仪表显示屏幕分类

2.1 划分PaddleClas训练集与验证集


├── train
│   ├── t0
│   │   ├── WIN_20230220_14_56_27_Pro.jpg
│   │   ├── ...
│   └── t1
│       ├── WIN_20230220_15_17_36_Pro.jpg
│       ├── ...
└── val
    ├── t0
    │   ├── WIN_20230220_14_47_59_Pro.jpg
    │   ├── ...
    └── t1
        ├── WIN_20230220_15_15_40_Pro.jpg
        ├── ...

6 directories, 99 files


with open('./work/data/step_2_clas/train/train_list.txt', 'w') as f:
    for filename in glob.glob('./work/data/step_2_clas/train/t0/*.jpg'):
        f.write('t0/' + filename.split('/')[-1] + ' 0')
    for filename in glob.glob('./work/data/step_2_clas/train/t1/*.jpg'):
        f.write('t1/' + filename.split('/')[-1] + ' 1')

with open('./work/data/step_2_clas/val/val_list.txt', 'w') as f:
    for filename in glob.glob('./work/data/step_2_clas/val/t0/*.jpg'):
        f.write('t0/' + filename.split('/')[-1] + ' 0')
    for filename in glob.glob('./work/data/step_2_clas/val/t1/*.jpg'):
        f.write('t1/' + filename.split('/')[-1] + ' 1')

2.2 训练PaddleClas分类模型

这里使用 ShuffleNetV2 进行模型的训练,配置文件主要需要关注:

# global configs
  checkpoints: null
  pretrained_model: null
  output_dir: ./output/
  device: gpu
  save_interval: 100
  eval_during_train: True
  eval_interval: 1
  epochs: 20
  print_batch_step: 1
  use_visualdl: False
  # used for static mode and model export
  image_shape: [3, 512, 512]
  save_inference_dir: ./inference

# model architecture
  name: ShuffleNetV2_x0_25
  class_num: 2

# data loader for train and eval
      name: ImageNetDataset
      image_root: /home/aistudio/work/data/step_2_clas/train/ # 数据集目录
      cls_label_path: /home/aistudio/work/data/step_2_clas/train/train_list.txt # 训练样本

      name: ImageNetDataset
      image_root: /home/aistudio/work/data/step_2_clas/val/ # 数据集目录
      cls_label_path: /home/aistudio/work/data/step_2_clas/val/val_list.txt # 验证样本

!python ./PaddleClas/tools/train.py \
    -c ./work/configs/ShuffleNetV2_x0_25.yaml  \
    -o Arch.pretrained=True

!python ./PaddleClas/tools/eval.py \
    -c ./work/configs/ShuffleNetV2_x0_25.yaml  \
    -o Global.pretrained_model=./output/ShuffleNetV2_x0_25/best_model

可以看到,这里的识别准确度已经较高了,接近 90%


# 默认的模型
!python3 ./PaddleOCR/tools/eval.py \
    -c ./work/configs/ch_PP-OCRv3_rec_distillation.yml \
    -o Global.checkpoints=./ch_PP-OCRv3_rec_train/best_accuracy


[2023/04/26 14:07:25] ppocr INFO: metric eval ***************
[2023/04/26 14:07:25] ppocr INFO: acc:0.5882349480970893
[2023/04/26 14:07:25] ppocr INFO: norm_edit_dis:0.816106550749648
[2023/04/26 14:07:25] ppocr INFO: Teacher_acc:0.6470584429067983
[2023/04/26 14:07:25] ppocr INFO: Teacher_norm_edit_dis:0.832283011822318
[2023/04/26 14:07:25] ppocr INFO: fps:9.186677358642257

# 训练的模型
!python3 ./PaddleOCR/tools/eval.py \
    -c ./work/configs/ch_PP-OCRv3_rec_distillation.yml \
    -o Global.checkpoints=./output/rec_ppocr_v3_distillation/best_accuracy

默认的预训练模型 acc0.588,经过finetune之后可以达到 0.882


plt.figure(figsize=(2, 2))
<matplotlib.image.AxesImage at 0x7f077c8789a0>


# 默认的模型
!python3 ./PaddleOCR/tools/infer_rec.py \
    -c ./work/configs/ch_PP-OCRv3_rec_distillation.yml \
    -o Global.pretrained_model=./ch_PP-OCRv3_rec_train/best_accuracy \

[2023/04/26 14:10:19] ppocr INFO: infer_img: work/data/step_4_ocr/val/Unit_WIN_20230220_14_56_07_Pro.jpg
[2023/04/26 14:10:20] ppocr INFO: 	 result: {"Student": {"label": "uT", "score": 0.7819735407829285}, "Teacher": {"label": "UT", "score": 0.7493851184844971}}
[2023/04/26 14:10:20] ppocr INFO: success!

# 训练的模型
!python3 ./PaddleOCR/tools/infer_rec.py \
    -c ./work/configs/ch_PP-OCRv3_rec_distillation.yml \
    -o Global.pretrained_model=./output/rec_ppocr_v3_distillation/best_accuracy \

[2023/04/26 14:11:01] ppocr INFO: infer_img: work/data/step_4_ocr/val/Unit_WIN_20230220_14_56_07_Pro.jpg
[2023/04/26 14:11:03] ppocr INFO: 	 result: {"Student": {"label": "μT", "score": 0.9993734359741211}, "Teacher": {"label": "μT", "score": 0.9988270998001099}}
[2023/04/26 14:11:03] ppocr INFO: success!

默认的预训练模型将图片识别为 uT,而finetune之后正确识别为 μT





img_filename = './work/data/train/WIN_20230220_14_56_27_Pro.jpg'
img_raw = cv2.imread(img_filename)
<matplotlib.image.AxesImage at 0x7f0777b39700>



img = cv2.resize(img_raw, (512, 512))
cv2.imwrite('./work/prediction/predict_img.jpg', img)


!python ./PaddleSeg/tools/predict.py \
       --config ./work/configs/pp_liteseg_optic_disc_512x512_1k.yml \
       --model_path ./output/best_model/model.pdparams \
       --image_path ./work/prediction/predict_img.jpg \
       --save_dir ./work/prediction/seg/


img_seg_predict = cv2.imread('work/prediction/seg/pseudo_color_prediction/predict_img.png')
biggest = get_contours(img_seg_predict)
img_det = get_det_img(img_seg_predict, img_raw, biggest)

plt.figure(figsize=(16, 6))
plt.imshow(img_seg_predict[..., ::-1])

plt.imshow(img_raw[..., ::-1])

plt.imshow(img_det[..., ::-1])   

<matplotlib.image.AxesImage at 0x7f0777ceaca0>


cv2.imwrite('./work/prediction/predict_screen.jpg', img_det)


./PaddleClas/tools/infer.py 没有保存结果的配置项,这里手动保存日志并提取结果。

!python ./PaddleClas/tools/infer.py \
    -c ./work/configs/ShuffleNetV2_x0_25.yaml  \
    -o Infer.infer_imgs=./work/prediction/predict_screen.jpg \
    -o Global.pretrained_model=./output/ShuffleNetV2_x0_25/best_model \
    > ./work/prediction/clas_log.txt
with open('./work/prediction/clas_log.txt') as f:
    prediction_clas = json.loads(f.readlines()[-1].strip()[1:-1].replace('\'', '\"'))
{'class_ids': [0],
 'scores': [0.99865],
 'file_name': './work/prediction/predict_screen.jpg',
 'label_names': []}

这里预测仪器屏幕为种类 0


prediction_clas = prediction_clas['class_ids'][0]

predict_mask = None
if prediction_clas == 0:
    predict_mask = t0_mask
elif prediction_clas == 1:
    predict_mask = t1_mask
    raise ValueError

keys = []
with open('./work/data/step_3_mask/class_list.txt') as f:
    for line in f.readlines()[1:]:
['Info_Probe', 'Freq_Set', 'Freq_Main', 'Val_Total', 'Val_X', 'Val_Y', 'Val_Z', 'Unit', 'Field']


!mkdir ./work/prediction/ocr/

for key in keys:
    _mask = predict_mask[key]
    # 判断有没有这个字段
    if np.sum(_mask) > 0:
        box = get_mask_box(_mask, threshold=0, margin=0)
        ocr_img = img_det[box[1][1]:box[2][1], box[0][0]:box[1][0], :][..., ::-1]
        filename = key + '.jpg'
        filename = './work/prediction/ocr/'+filename
        cv2.imwrite(filename, ocr_img)

<matplotlib.image.AxesImage at 0x7f0777a59970>



!python3 ./PaddleOCR/tools/infer_rec.py \
    -c ./work/configs/ch_PP-OCRv3_rec_distillation.yml \
    -o Global.pretrained_model=./output/rec_ppocr_v3_distillation/best_accuracy \
    Global.infer_img=./work/prediction/ocr/ \


results_teacher = {}
results_student = {}
with open('./work/prediction/predicts_ppocrv3_distillation.txt') as f:
    for line in f.readlines():
        _filename, _result = line.strip().split('\t')
        _key = _filename.split('/')[-1].split('.')[0]
        _value_s = json.loads(_result)['Teacher']['label']
        _value_t = json.loads(_result)['Student']['label']
        results_student[_key] = _value_s
        results_teacher[_key] = _value_t
results_teacher, results_student
({'Field': '磁场',
  'Freq_Set': '100Hz',
  'Info_Probe': '探头:LF-01',
  'Unit': 'μT',
  'Val_Total': '1.8330',
  'Val_X': ':1.8077',
  'Val_Y': ':0.1609',
  'Val_Z': 'z-0.2573'},
 {'Field': '磁场',
  'Freq_Set': '100Hz',
  'Info_Probe': '探头:LF-01',
  'Unit': 'μm',
  'Val_Total': '1.8330',
  'Val_X': ':1.8077',
  'Val_Y': '.0.1609',
  'Val_Z': '.0.2573'})

最后,这里还可以进行后处理,比如 μm 明显错误,应该是 μT.0.2573 不是正常数字,应该是 0.2573


本文演示了如何利用 PaddleOCR/PaddleClas/PaddleSeg 进行工频场强计读数识别。



可以看到,基于此次数据集的模型,最终识别结果接近 90% ,而且,这只是在标注了 27 张图片的基础上得到的。



  • 为什么不用 KIE 或者 检测-识别 模型

    这里是尝试过使用 layoutxlm 模型,以及 检测-识别 方案(参考《基于PP-OCRv3的电表检测识别》),但是在少量标注的情况下,检测模型的 H-Means 只能到 0.5 左右,这与使用 PaddleClas+Mask 的方法相去甚远。

    由于检测模型是整个流程的关键点,如果这里出错,后面的识别准确性大大降低,所以,在数据集有限的情况下,这里选用 PaddleClas+Mask+PaddleOCR 的方案。

    另外,工业场景不同于电表监测这类民用场景,工业场景相对固定,以本文为例,检测仪表一般不会轻易更换,而且仪表的种类也相对有限。这对于 PaddleClas+Mask+PaddleOCR 的方案更有利。

  • 优劣

    • 检测-识别 适应性好,PaddleClas+Mask 的方法如果分类一错,后面都错。
    • 检测-识别 的精准度没有 PaddleClas+Mask 好。
  • 局限性



    就以人类自己的学习过程而言,如果只学会识别其中一种仪器,当拿到新设备后都需要重新学习,更不用说使用模型识别,检测-识别 方案、PaddleClas+Mask+PaddleOCR 的方案都有此局限性。



  • PaddleClas 要手动读取结果,是否有更简单的方法?
  • PaddleSeg/PaddleClas/PaddleOCR 模型可以导出后进行部署。
  • 标注更多的图片、更好的模型可以得到更好的结果。


├── ch_PP-OCRv3_rec_train # 识别模型的预训练模型
│   └── best_accuracy.pdparams
├── main.ipynb # 此 notebook
├── output
│   ├── best_model # 分割模型训练目录
│   │   └── model.pdparams
│   ├── iter_1000 # 分割模型训练目录
│   │   ├── model.pdopt
│   │   └── model.pdparams
│   ├── rec # 验证集识别结果
│   │   └── predicts_ppocrv3_distillation.txt
│   ├── rec_ppocr_v3_distillation # 识别模型训练目录
│   │   ├── best_accuracy.pdopt
│   │   ├── best_accuracy.pdparams
│   │   ├── best_accuracy.states
│   │   ├── config.yml
│   │   ├── latest.pdopt
│   │   ├── latest.pdparams
│   │   ├── latest.states
│   │   └── train.log
│   ├── ShuffleNetV2_x0_25 # 分类模型训练目录
│   │   ├── best_model.pdopt
│   │   ├── best_model.pdparams
│   │   ├── best_model.pdstates
│   │   ├── eval.log
│   │   ├── infer.log
│   │   ├── latest.pdopt
│   │   ├── latest.pdparams
│   │   ├── latest.pdstates
│   │   └── train.log
│   └── vdlrecords.1682433212.log
├── PaddleClas
│   ├── ...
├── PaddleOCR
│   ├── ...
├── PaddleSeg
│   ├── ...
└── work
    ├── configs # 各个模型的配置文件
    │   ├── ch_PP-OCRv3_rec_distillation.yml
    │   ├── pp_liteseg_optic_disc_512x512_1k.yml
    │   └── ShuffleNetV2_x0_25.yaml
    ├── data # 数据目录
    │   ├── added_prediction
    │   ├── digital_rec_hackon_train.zip # 原始数据
    │   ├── pseudo_color_prediction
    │   ├── step_1_512_img
    │   ├── step_1_512_img_anno_seg_box.json # 分割标注文件
    │   ├── step_1_screen
    │   ├── step_1_seg
    │   ├── step_2_clas
    │   ├── step_3_mask
    │   ├── step_3_screen_anno_kie.json # 关键信息标注文件
    │   ├── step_4_ocr
    │   └── train # 原始数据解压后得到
    └── prediction # 图片识别结果目录
        ├── clas_log.txt
        ├── ocr
        ├── predict_img.jpg
        ├── predict_screen.jpg
        ├── predicts_ppocrv3_distillation.txt
        └── seg


