PaddleOCR—PPstructure在Windows环境下搭建及使用

文章介绍了如何使用PaddlePaddle的PaddleOCR工具进行ppstructure模型的部署,包括环境配置、模型下载、依赖安装和图像识别处理的步骤。用户需根据需求选择CPU或GPU版本,并从GitHub的model-list下载模型,利用国内镜像源加速安装过程。
摘要由CSDN通过智能技术生成

1. ppstructure的github地址:https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6/ppstructure

2.  所需环境:我的环境是py 3.8

        首先需要拉取paddleocr的源码:

https://github.com/PaddlePaddle/PaddleOCR.git

然后就是在ppstructure中创建inference文件夹放置模型

 

模型可以根据自己的需求在github上的model-list找寻下载。

3. 安装依赖

安装paddleocr依赖

pip install -r requirements.txt 

安装paddlepaddle

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

以上的是cpu版本,需要gpu版本可以去github看看。在这里提醒一下,建议pip源用国内的清华源,不然下载容易断链接不稳定

安装paddleocr的whl包

 pip install "paddleocr>=2.6.0.3"

pip install paddleclas>=2.4.3

4. 图像识别处理

python predict_system.py --image_dir=.\docs\table\table10.jpg --det_model_dir=.\inference\ch_PP-OCRv3_det_infer --rec_model_dir=.\inference\ch_PP-OCRv3_rec_infer --rec_char_dict_path=..\ppocr\utils\ppocr_keys_v1.txt --table_model_dir=inference\ch_ppstructure_mobile_v2.0_SLANet_infer --table_char_dict_path=..\ppocr\utils\dict\table_structure_dict.txt --layout_model_dir=inference\picodet_lcnet_x1_0_fgd_layout_cdla_infer --layout_dict_path=..\ppocr\utils\dict\layout_dict\layout_cdla_dict.txt --vis_font_path=..\doc\fonts\simfang.ttf --recovery=True --output=..\output\ 在cmd的ppstructure目录下输入此指令即可,根据自己的模型以及文件进行相应更改

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
PaddleOCR是一个基于PaddlePaddle深度学习框架的开源OCR工具库,它提供了丰富的OCR功能和模型,其中包括ppstructurePaddleOCR Structure)模块。ppstructure是用于文本结构化的模块,可以将OCR识别结果中的文本进行结构化处理,提取出表格、标题、段落等结构信息。 使用ppstructure模块进行文本结构化的步骤如下: 1. 安装PaddleOCR:首先需要安装PaddleOCR库,可以通过pip命令进行安装:`pip install paddlepaddle paddleocr` 2. 导入相关库:在Python代码中导入所需的库,包括`paddleocr`和`paddleocr.structures`。 3. 初始化PaddleOCR模型:使用`paddleocr.OCR`类初始化PaddleOCR模型,并加载预训练的模型权重。 4. 进行OCR识别:使用PaddleOCR模型对图像或文本进行OCR识别,获取识别结果。 5. 使用ppstructure模块进行结构化处理:将OCR识别结果传入`paddleocr.structures.TextStructureBuilder`类的实例中,通过调用其方法进行文本结构化处理。 6. 获取结构化结果:从结构化处理后的结果中提取所需的结构信息,例如表格、标题、段落等。 以下是一个简单的示例代码: ```python import paddleocr from paddleocr import structures # 初始化PaddleOCR模型 ocr = paddleocr.OCR() # 进行OCR识别 image_path = 'path/to/your/image.jpg' result = ocr.ocr(image_path) # 使用ppstructure模块进行结构化处理 builder = structures.TextStructureBuilder() structure_result = builder.build(result) # 获取结构化结果 tables = structure_result.tables titles = structure_result.titles paragraphs = structure_result.paragraphs # 打印结果 print("Tables:", tables) print("Titles:", titles) print("Paragraphs:", paragraphs) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值