PICK-pytorch 项目使用教程

邴富畅Pledge

于 2024-09-25 07:38:46 发布

阅读量754

点赞数 11

本文链接：https://blog.csdn.net/gitblog_00102/article/details/142505891

版权

PICK-pytorch 项目使用教程

PICK-pytorch Code for the paper "PICK: Processing Key Information Extraction from Documents using Improved Graph Learning-Convolutional Networks" (ICPR 2020) 项目地址: https://gitcode.com/gh_mirrors/pi/PICK-pytorch

1. 项目介绍

PICK-pytorch 是一个基于 PyTorch 的开源项目，旨在通过改进的图学习-卷积网络（Graph Learning-Convolutional Networks）处理文档中的关键信息提取（Key Information Extraction, KIE）。该项目在 ICPR 2020 上发表的论文 "PICK: Processing Key Information Extraction from Documents using Improved Graph Learning-Convolutional Networks" 中首次提出。

PICK 框架通过结合图学习和图卷积操作，能够有效且鲁棒地处理复杂文档布局，提取关键信息。它不仅考虑了文本和视觉特征，还结合了全局布局信息，从而生成更丰富的语义表示。

2. 项目快速启动

2.1 环境准备

首先，确保你的环境中安装了以下依赖：

python = 3.6
torchvision = 0.6.1
tabulate = 0.8.7
overrides = 3.0.0
opencv_python = 4.3.0.36
numpy = 1.16.4
pandas = 1.0.5
allennlp = 1.0.0
torchtext = 0.6.0
tqdm = 4.47.0
torch = 1.5.1

你可以通过以下命令安装这些依赖：

pip install -r requirements.txt

2.2 下载项目

使用 Git 克隆项目到本地：

git clone https://github.com/wenwenyu/PICK-pytorch.git
cd PICK-pytorch

2.3 配置文件

在 config.json 文件中配置训练参数，例如数据集路径、模型参数等。

2.4 启动训练

使用以下命令启动分布式训练：

bash dist_train.sh

或者，如果你只想在单个 GPU 上进行训练，可以使用以下命令：

python train.py -c config.json -d 0 -dist false

2.5 测试模型

训练完成后，你可以使用以下命令进行测试：

python test.py --checkpoint path/to/checkpoint --boxes_transcripts path/to/boxes_transcripts --images_path path/to/images_path --output_folder path/to/output_folder --gpu 0 --batch_size 2