PPOCRLabel使用说明

PPOCRLabel是一款适用于OCR领域的半自动化图形标注工具,内置PPOCR模型对数据自动标注和重新识别。使用python3和pyqt5编写,支持矩形框标注和四点标注模式,导出格式可直接用于PPOCR检测和识别模型的训练。

安装

1.环境搭建
1.1安装PaddlePaddle

python3 -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple

一般去官网选择适合版本安装

1.2安装PaddleOCR
github地址
getee地址
安装教程里面写的有
1.3安装PPOCRLabel
Windows

pip install pyqt5
cd ./PPOCRLabel # 将目录切换到PPOCRLabel文件夹下
python PPOCRLabel.py --lang ch// An highlighted block
var foo = 'bar';

注:原先的打开方式较为麻烦,每次都要输入代码,可以在PPOCRLabel文件夹下新建一个txt,输入python PPOCRLabel.py --lang ch然后保存成open.bat文件,以后每次打开就点这个文件就可以了

2.操作步骤
2.1安装与运行:使用上述命令安装与运行程序。
2.2打开文件夹:在菜单栏点击 “文件” - “打开目录” 选择待标记图片的文件夹[1].
2.3自动标注:点击 ”自动标注“,使用PPOCR超轻量模型对图片文件名前图片状态[2]为 “X” 的图片进行自动标注。
2.4手动标注:点击 “矩形标注”(推荐直接在英文模式下点击键盘中的 “W”),用户可对当前图片中模型未检出的部分进行手动绘制标记框。点击键盘Q,则使用四点标注模式(或点击“编辑” - “四点标注”),用户依次点击4个点后,双击左键表示标注完成。
2.5标记框绘制完成后,用户点击 “确认”,检测框会先被预分配一个 “待识别” 标签。
2.6重新识别:将图片中的所有检测画绘制/调整完成后,点击 “重新识别”,PPOCR模型会对当前图片中的所有检测框重新识别[3]。
2.7内容更改:双击识别结果,对不准确的识别结果进行手动更改。
2.8确认标记:点击 “确认”,图片状态切换为 “√”,跳转至下一张。
2.9删除:点击 “删除图像”,图片将会被删除至回收站。
2.10导出结果:用户可以通过菜单中“文件-导出标记结果”手动导出,同时也可以点击“文件 - 自动导出标记结果”开启自动导出。手动确认过的标记将会被存放在所打开图片文件夹下的Label.txt中。在菜单栏点击 “文件” - "导出识别结果"后,会将此类图片的识别训练数据保存在crop_img文件夹下,识别标签保存在rec_gt.txt中[4]。
在这里插入图片描述
在这里插入图片描述
转载自 https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值