一、环境准备
1、适用系统:Windows
2、适用Python版本:Python3.7
3、前提条件:Anaconda,PaddlePaddle,lmdb。
4、简介:PPOCRLabel 是 PaddleOCR 配套标注工具,支持图像文本检测与识别标注、编辑及格式导出,用于制备 OCR 模型训练的高质量标注数据。
二、操作步骤
1、创建并激活虚拟环境
conda create -n PPOCR python=3.7
conda activate PPOCR
2、安装对应版本飞桨 PaddlePaddle
(1)CPU:
pip install paddlepaddle==2.3.2 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html
(2)GPU:
pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html
3、安装 PPOCRLabel 库
pip install PPOCRLabel -i https://pypi.tuna.tsinghua.edu.cn/simple
4、安装兼容完整的 lmdb 库
pip uninstall -y lmdb
conda install -c conda-forge lmdb
若安装损坏的 lmdb 库,会出现以下报错:

5、启动 PPOCRLabel 标注工具
①直接启动命令
PPOCRLabel #默认英文方式启动
PPOCRLabel --lang ch #中文方式启动
②开启关键信息提取功能
PPOCRLabel --lang ch --kie True
三、简单使用
1、执行启动命令后窗口正常打开:

2、左上角点击文件,打开存放图片的目录。
(1)点击左下角自动标注或使用快捷键Ctrl+Shift+R即可:

(2)标注图片示例
①车牌广告牌

②楼房建筑


③发票信息标注

四、补充与扩展
1、基础快捷键使用说明:
| 快捷键 | 说明 |
|---|---|
| Ctrl+Shift+R | 重新识别当前图片所有标注框的文本 |
| A | 上一张图片 |
| D | 下一张图片 |
| Ctrl+Shift+D | 删除当前图片 |
| 空格 | 确认当前图片标注并切换到下一张 |
| W | 创建矩形标注框 |
| Q | 创建四点标注框(适用于不规则文本) |
| ↑↓←→ | 微调选中标注框位置 |
| Backspace | 删除选中的标注框 |
| Ctrl+E | 编辑选中标注框的文本标签 |
| Ctrl+R | 重新识别选中标注框内的文本 |
| Ctrl+C | 复制选中的标注框 |
| Ctrl + 鼠标左键 | 多选标注框 |
| X | 逆时针旋转选中的标注框 |
| Ctrl+Shift+Z | 撤销上一步操作 |
| Ctrl++ | 缩小图片视图 |
| Ctrl-- | 放大图片视图 |
| Ctrl+X | 修改选中标注框的关键字类型(KIE 模式特有快捷键) |
2、创建快捷方式(找到对应环境的Scripts文件夹下的exe文件,发送快捷方式到桌面)

9199

被折叠的 条评论
为什么被折叠?



