半自动化OCR标注工具PPOCRLabel本地编译运行

前言

在使用paddleOCR默认的推理模型,发现文本检测不能适用于全部场景,这时候就需要自行准备数据集进行标注、训练。正好看到paddle有开源的半自动化数据集标注工具。记录使用过程。
根据官方readme文档整理 PPOCRLabel readme

下载源代码

官方仓库直接下载:https://gitee.com/paddlepaddle/PaddleOCR/tree/release/2.7.1
在这里插入图片描述
解压后,使用IDE打开PPOCRLabel 文件夹
在这里插入图片描述

配置python环境

参考 PaddleOCR环境搭建并简单提取文字 配置运行环境
查看PPOCRLabel/requirements.txt

pyqt5
paddleocr
xlrd==1.2.0

还需要安装pyqt5xlrd依赖,直接在创建的conda运行环境内使用pip install 安装对应依赖包即可

修改默认中文启动

打开文件 PPOCRLabel.py 搜索def get_main_app 方法 将default='en' 改为 'default='ch'
中文启动参数修改

注释无用代码

还是在 PPOCRLabel.py 文件内,搜索 if os.path.exists('./data/paddle.png'):
将如图的三行代码注释:
在这里插入图片描述

启动PPOCRLabel

右键启动 PPOCRLabel.py在这里插入图片描述

启动成功后,会自动弹出PPOCRLabel程序
在这里插入图片描述

使用教程参照官方文档
PPOCRLabel官方文档
B站官方视频教程
告别手动标注-OCR自动标注小工具讲解

  • 15
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值