PPOCRLabel使用说明

最新推荐文章于 2024-04-09 15:04:35 发布

凌花钱

最新推荐文章于 2024-04-09 15:04:35 发布

阅读量6.4k

点赞数 3

分类专栏： paddleOCR 文章标签： pytorch 深度学习

原文链接：https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md

版权

paddleOCR 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

PPOCRLabel是一款适用于OCR领域的半自动化图形标注工具，内置PPOCR模型对数据自动标注和重新识别。使用python3和pyqt5编写，支持矩形框标注和四点标注模式，导出格式可直接用于PPOCR检测和识别模型的训练。

安装

1.环境搭建
1.1安装PaddlePaddle

python3 -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple

一般去官网选择适合版本安装

1.2安装PaddleOCR
github地址
 getee地址
安装教程里面写的有
1.3安装PPOCRLabel
Windows

pip install pyqt5
cd ./PPOCRLabel # 将目录切换到PPOCRLabel文件夹下
python PPOCRLabel.py --lang ch// An highlighted block
var foo = 'bar';

注：原先的打开方式较为麻烦，每次都要输入代码，可以在PPOCRLabel文件夹下新建一个txt，输入python PPOCRLabel.py --lang ch然后保存成open.bat文件，以后每次打开就点这个文件就可以了

2.操作步骤
2.1安装与运行：使用上述命令安装与运行程序。
2.2打开文件夹：在菜单栏点击 “文件” - “打开目录” 选择待标记图片的文件夹[1].
2.3自动标注：点击 ”自动标注“，使用PPOCR超轻量模型对图片文件名前图片状态[2]为 “X” 的图片进行自动标注。
2.4手动标注：点击 “矩形标注”（推荐直接在英文模式下点击键盘中的 “W”)，用户可对当前图片中模型未检出的部分进行手动绘制标记框。点击键盘Q，则使用四点标注模式（或点击“编辑” - “四点标注”），用户依次点击4个点后，双击左键表示标注完成。
2.5标记框绘制完成后，用户点击 “确认”，检测框会先被预分配一个 “待识别” 标签。
2.6重新识别：将图片中的所有检测画绘制/调整完成后，点击 “重新识别”，PPOCR模型会对当前图片中的所有检测框重新识别[3]。
2.7内容更改：双击识别结果，对不准确的识别结果进行手动更改。
2.8确认标记：点击 “确认”，图片状态切换为 “√”，跳转至下一张。
2.9删除：点击 “删除图像”，图片将会被删除至回收站。
2.10导出结果：用户可以通过菜单中“文件-导出标记结果”手动导出，同时也可以点击“文件 - 自动导出标记结果”开启自动导出。手动确认过的标记将会被存放在所打开图片文件夹下的Label.txt中。在菜单栏点击 “文件” - "导出识别结果"后，会将此类图片的识别训练数据保存在crop_img文件夹下，识别标签保存在rec_gt.txt中[4]。
在这里插入图片描述

转载自 https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md

凌花钱

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
2
评论
PPOCRLabel使用说明

PPOCRLabel是一款适用于OCR领域的半自动化图形标注工具，内置PPOCR模型对数据自动标注和重新识别。使用python3和pyqt5编写，支持矩形框标注和四点标注模式，导出格式可直接用于PPOCR检测和识别模型的训练。安装1.环境搭建1.1安装PaddlePaddlepython3 -m pip install paddlepaddle-gpu==2.0.0 -i https://mirror.baidu.com/pypi/simple一般去官网选择适合版本安装1.2安装PaddleO
复制链接

扫一扫